沃尔德在统计研究小组 (SRG) 的八份技术备忘录中编写了他的分析,这些文件已由海军分析中心出版,因此您可以实际阅读它们并确切了解他在书面工作中所做的工作。原始备忘录可在此处找到, Mangel 和 Samaniego (1984)对他在飞机生存方面的工作进行了很好的总结和分析。如果您阅读本文和随附的技术备忘录,您会发现 Wald 确实开发了一个飞机生存的理论模型来得出他的结论。
Wald 的分析涵盖了多个问题,首先是根据被击中飞机的次数来估计飞机的生存概率,然后更详细地根据被击中的次数和位置进行估计。他的方法基本上是这样的。对于任何在轰炸中离开的飞机,都有一个飞机将要承受的命中次数的分布。对于任何给定的命中次数,都有相关的生存概率;假设一架没有命中的飞机以 1 的概率存活,并且每次命中的存活概率是某个正概率。基于此,可以使用返回飞机上的数据来估计每次命中的条件生存概率。(假设任何不返回的飞机至少被击中一次,
为了处理命中不同位置的不同概率,Wald 扩展了他的模型,将平面划分为有限数量的位置,并扩展了模型,使得每次命中每个位置都有未知的生存条件概率。Wald 假设点击到特定位置的条件分布(给定点击总数)是已知的。他提出了这样一种观点,即这可以在军事研究中心内通过向真实飞机发射假子弹来进行实验确定。给定这些概率的假设值(基于独立实验)和一些合理的统计独立性假设,然后您可以使用返回飞机上命中次数和位置的数据来估计特定位置上每次命中的条件生存概率. (再次,假设任何不返回的飞机至少被击中一次,并且缺少数据。)如果你制定这样的模型,这里考虑的现象就会出现——即,在特定位置观察到的击中次数越多,该位置上的命中的估计生存概率就越高。因此,飞机上显示出最低存活概率的部分将是那些在返回飞机中被击中次数最少的部分(相对于在该位置被击中的概率)。该位置命中的估计生存概率越高。因此,飞机上显示出最低存活概率的部分将是那些在返回飞机中被击中次数最少的部分(相对于在该位置被击中的概率)。该位置命中的估计生存概率越高。因此,飞机上显示出最低存活概率的部分将是那些在返回飞机中被击中次数最少的部分(相对于在该位置被击中的概率)。
Wald 关于这个主题的技术备忘录为他的模型和未知条件概率的估计方法提供了具体的公式。尽管如此,没有必要了解技术细节来理解他的基本见解,即飞机上(在返回的飞机上)表现出低命中率的区域实际上是最脆弱的部分。这个故事如此精彩的原因在于它说明了一个涉及缺失数据的反直觉问题,其中大多数人的直觉答案与正确答案相反。我曾多次在统计研讨会上用这个问题作为教学示例,当被问及他们的建议时,听众不可避免地建议应该在数据中显示出最大损坏的飞机部分附加更多的装甲。当他们被告知沃尔德'
最后,关于围绕这一点出现的实际民间传说,我不知道有任何证据表明沃尔德与军方进行了哪些对话,他说了什么,或者谁不同意他(或者对他的建议感到惊讶)。然而,在我听到的故事的版本中,他不同意的不是其他统计学家,而是缺乏统计培训的军官需要对这个缺失数据的问题有直观的正确答案。无论如何,这是一个关于一个聪明人的精彩故事。