参考要求:鹳鸟带娃

机器算法验证 相关性 参考 因果关系 历史
2022-03-03 19:02:47

有一个众所周知的统计例子,声称阿尔萨斯/丹麦/荷兰/德国村庄或欧洲国家的婴儿数量与该地区的鹳数量之间存在相关性。这个例子的幽默“暗示”是鹳确实会带来婴儿这个例子经常被用来说明相关性和因果关系之间的区别。

我想知道这个例子最初是由谁创造的。到目前为止,我找到了两篇关于这个例子的参考资料。我检查了这个答案并发现

Sies, H. (1988),性教育的新参数,Nature 332, 495;https://doi.org/10.1038/332495a0

此外,我发现

Matthews, R. (2000),鹳送婴儿 (p= 0.008)教学统计,22:36-38。https://doi.org/10.1111/1467-9639.00013

在网上,我还找到了 G. Udny Yule 的作者,他是《统计理论导论》(1911 年)的作者和 Darrell Huff,《如何与统计说谎》(1954 年)的作者。在这两本书中,我都找不到关于这个主题的段落。由于 G. Udny Yule 是被命名的作者中最年长的,我愿意相信他是鹳和婴儿例子的发明者,但我希望看到有参考文献证明或证伪我的假设。

2个回答

据我所知,最初的参考文献是这个(在 Kronmal 1993 引用之后,一篇阅读量非常低的论文恕我直言):

Neyman, J. (1952) Lectures and Conferences on Mathematical Statistics and Probability,第 2 版,第 143-154 页。华盛顿特区:美国农业部。

从第 143 页开始描述和分析了鹳和婴儿的数据。尽管(或者可能是因为)内曼用“从前我的一个好奇的朋友决定凭经验研究这个问题”来介绍它们,但这些数据显然是虚构的。

鹳和婴儿之后是一个铁路的例子,其分析结果显然是真实的,但其原始数据被重建以显示同样的谬误可能是如何起作用的,“伊芙琳·菲克斯小姐很友善地准备了表 IV,表明可能一直是原始数据 [...]”

在其他引文中:来自 Matthews 的数据来自大约 50 年后,但似乎与 Neyman 的结构相同。它(我认为)是真实的,并且似乎是独立收集的。我找不到可搜索的 Yule 版本,因此尽管个人不喜欢翻阅旧的统计教科书,但我还没有找到时间进行搜索。也许一只鸟会给我们带来参考。

这篇(http://www.nieuwarchief.nl/serie5/pdf/naw5-2010-11-2-134.pdf)荷兰杂志文章提到

GEP Box,WG Hunter en JS Hunter(1978 年),实验者统计:设计、数据分析和模型构建简介,纽约:John Wiley,p。8

作为第一个例子。盒子等人。显然使用了 30 年代德国奥尔登堡的数据集(杂志文章中也对此进行了分析)。