这种统计谬误的名称是什么?

机器算法验证 可能性 相关性 统计学意义
2022-03-20 02:47:06

今天有人告诉我一个轶事,他试图证明关于安全的观点。他们说:“过去两年一年 50人住在[a区] (显然我记错了谈话),没有发生任何事故,因此该地区对更多人居住是安全的。”

[区域 a] 恰好是政府认为的高风险区域,对人身安全(特别是死亡)的威胁较高。我知道这个人的推理是有缺陷的,但我想知道这个缺陷的确切名称和解释,因为我觉得这是一个很常见的问题。

我看到导致错误的两个主要因素:

  • 小样本量
  • 风险在事物的“死亡”方面占很大比重,这并不是被剪纸的高风险

尽管该人说“没有发生任何事件”在技术上是正确的,但我如何指出这个缺陷?

为清楚起见进行编辑:这个 [区域 a] 相当于一座建筑物,并且不仅仅被这个样本集占据。该区域位于较大的区域内,该区域的伤害或死亡风险较高,并且该区域没有提供针对它的特殊保护。风险事件很少见,但肯定高于背景发生率,并且确实发生在这个更大的地区。

4个回答

我没有这个谬误的具体名称,但这里有一个我认为相关的参考资料(沿着小数定律):

最危险的方程式

还有一个统计经验法则(参见第 2.9 节)表示,对于 2 年内没有发生的 2 年发病率,大约 95% 的置信区间将从 0 到,因此发病率可能为高达 6%。因此,如果您再搬迁 1,000 人,那么在接下来的 2 年中看到 60 起事件也就不足为奇了。350

再想一想,如果因为没有发生事件而选择了小区域,并且在较大区域中有一些,那么这将是德克萨斯神枪手谬误的一种变体。

这不是谬误,而是大卫休谟推广的归纳问题。

幸存者谬误的一般情况:

只看/寻找没有失败的东西会扭曲你的看法。这可能会导致您陷入未经测试并因此无法容忍失败的行为。

常见的例子是观察从空战中返回的飞机:“你需要在返回的飞机被击中的地方增加装甲吗?” 据说这是飞机可能被击中的地方

然而,答案是违反直觉的“不,因为那是飞机可能被击中 并幸存的地方。” 因此,无论如何,命中都是可以生存的。

当你在“幸存者”没有被击中的地方增加护甲时,你会获得真正的结果,因为那是“非幸存者”被击中的地方。

对于您的情况(单数):

在将一个人转移到有事故导致死亡的地区的前提下。我是否需要搬入未受事故影响的子区域?

不,对于那些子领域,您根本没有确凿的数据。

相反,您需要进入一个事件确实发生但不会导致死亡的子区域。目标不是没有事故,而是在事故发生时幸存下来,对吧?

如果您不希望事件发生,那么您首先不应该搬到更大的区域!

对于您的情况(复数):

如果您想将统计上相关的人数转移到事件可生存的区域,您需要首先检查事件可生存的原因是否是该区域的人口密度低。

如果事件在人口密度低的地区是可以幸存的,那么将人员搬入不会使人们安全,但该地区却不安全。

对事物的另一种看法:

如果更大的地区有 1000 人,其中 20 人在上次事件中死亡,那么还有 980 名幸存者可以讲述这个故事。是否安全,因为幸存的人多于死亡的人?

当然,这 980 人中的大多数人甚至还没有接近死亡的 20 人,当它发生时。如果你问这些,它会变得更安全吗?

你能问问那 20 名死者,他们是否还认为它安全?

底线是,只要您询问没有目击事件的幸存者,您就会感到安全。由于只能询问幸存者,因此他们很可能没有目睹这一事件。

因此,幸存者谬误

相关谬误:

其他人提到了其他谬误。我不想详细重复它们。但是我确实看到它们也适用。因此,这里有一个汇编以及它们适用的方面以及它们为何不同:

  • 幸存者谬误:只关注有利的结果。
  • 德州神枪手谬误:事后选择子样本。
  • 热手谬误:将结果的随机变化解释为概率分布的指示,尤其是在查看最近的历史时。
  • 小数法:依靠数据不足。
  • 基准率谬误:低估一般信息的重要性,而倾向于更具体的信息。

还有一个众所周知的谬误,我最初误认为是“热手”。现在想来,它实际上并不适用:

  • 赌徒谬误:误解大数定律意味着独立事件从长远来看会平局。

这是一种倒置的热手谬误:爱上“热手”你会押注最近历史上最常发生的事情,因为它看起来更有可能。
爱上“赌徒”,你会反对最常发生的事情,因为从长远来看,相反的情况似乎需要平衡。