亚伯拉罕沃尔德生存偏差直觉

机器算法验证 可能性 数理统计 悖论 选择偏差
2022-03-05 21:28:48

二战期间,统计学家亚伯拉罕沃尔德在考虑如何将轰炸机对敌方火力造成的损失降至最低时,将幸存者偏差纳入了他的计算中。沃尔德指出,这项研究只考虑了在任务中幸存下来的飞机。任何被击落或以其他方式丢失的轰炸机在逻辑上也无法评估。因此,返回飞机上的洞代表了轰炸机可能受到伤害并仍能安全返回家园的区域。因此,沃尔德建议海军加强返回飞机毫发无损的区域,因为这些区域一旦被击中,就会导致飞机失联。

飞机上的孔

所以这就是我想到的事情:Wald 是从什么直觉中得出这样的想法的?因为作为一名统计学家,我认为同样为了他工作的严谨性,他很可能不得不通过数学证明证明,事实上有必要在没有孔的地方加固装甲,而不是简单地先强制装甲,然后然后观察这是否会产生积极的影响。

他的想法是从某种公式中产生的吗?从什么思维模式下,他可以做与所有统计同事的想法相反的事情?对我来说,一方面是直观地获得这种洞察力,另一方面是能够以数学方式描述它。

3个回答

沃尔德在统计研究小组 (SRG) 的八份技术备忘录中编写了他的分析,这些文件已由海军分析中心出版,因此您可以实际阅读它们并确切了解他在书面工作中所做的工作。原始备忘录可在此处找到, Mangel 和 Samaniego (1984)对他在飞机生存方面的工作进行了很好的总结和分析如果您阅读本文和随附的技术备忘录,您会发现 Wald 确实开发了一个飞机生存的理论模型来得出他的结论。

Wald 的分析涵盖了多个问题,首先是根据被击中飞机的次数来估计飞机的生存概率,然后更详细地根据被击中的次数和位置进行估计。他的方法基本上是这样的。对于任何在轰炸中离开的飞机,都有一个飞机将要承受的命中次数的分布。对于任何给定的命中次数,都有相关的生存概率;假设一架没有命中的飞机以 1 的概率存活,并且每次命中的存活概率是某个正概率。基于此,可以使用返回飞机上的数据来估计每次命中的条件生存概率。(假设任何不返回的飞机至少被击中一次,

为了处理命中不同位置的不同概率,Wald 扩展了他的模型,将平面划分为有限数量的位置,并扩展了模型,使得每次命中每个位置都有未知的生存条件概率。Wald 假设点击到特定位置的条件分布(给定点击总数)是已知的。他提出了这样一种观点,即这可以在军事研究中心内通过向真实飞机发射假子弹来进行实验确定。给定这些概率的假设值(基于独立实验)和一些合理的统计独立性假设,然后您可以使用返回飞机上命中次数和位置的数据来估计特定位置上每次命中的条件生存概率. (再次,假设任何不返回的飞机至少被击中一次,并且缺少数据。)如果你制定这样的模型,这里考虑的现象就会出现——即,在特定位置观察到的击中次数越多,该位置上的命中的估计生存概率就越高。因此,飞机上显示出最低存活概率的部分将是那些在返回飞机中被击中次数最少的部分(相对于在该位置被击中的概率)。该位置命中的估计生存概率越高。因此,飞机上显示出最低存活概率的部分将是那些在返回飞机中被击中次数最少的部分(相对于在该位置被击中的概率)。该位置命中的估计生存概率越高。因此,飞机上显示出最低存活概率的部分将是那些在返回飞机中被击中次数最少的部分(相对于在该位置被击中的概率)。

Wald 关于这个主题的技术备忘录为他的模型和未知条件概率的估计方法提供了具体的公式。尽管如此,没有必要了解技术细节来理解他的基本见解,即飞机上(在返回的飞机上)表现出低命中率的区域实际上是最脆弱的部分。这个故事如此精彩的原因在于它说明了一个涉及缺失数据的反直觉问题,其中大多数人的直觉答案与正确答案相反。我曾多次在统计研讨会上用这个问题作为教学示例,当被问及他们的建议时,听众不可避免地建议应该在数据中显示出最大损坏的飞机部分附加更多的装甲。当他们被告知沃尔德'

最后,关于围绕这一点出现的实际民间传说,我不知道有任何证据表明沃尔德与军方进行了哪些对话,他说了什么,或者谁不同意他(或者对他的建议感到惊讶)。然而,在我听到的故事的版本中,他不同意的不是其他统计学家,而是缺乏统计培训的军官需要对这个缺失数据的问题有直观的正确答案。无论如何,这是一个关于一个聪明人的精彩故事。

我感谢所有花时间提供答案的人。

与此同时,我一直在寻找有关该主题的更多信息,并找到了他的文章,其中包含直觉和数学证明。按照这个链接:

https://apps.dtic.mil/dtic/tr/fulltext/u2/a091073.pdf

在此处输入图像描述

真是一位了不起的统计学家!

我认为只是亚伯拉罕沃尔德是一个聪明的人,一个成熟的统计学家,他看到观察到的飞机不是随机样本,而是幸存者自我选择的样本。

我不认为可以给出某些具体领域需要加强的“数学证明”。相反,Wald 所做的是对手头数据进行明智的描述性分析,并辅以合理的统计判断。我想当他提议加固没有影响的区域时,主题专家会查看这些区域并确认它们是需要保护的关键区域。