一个人在生日那天去世的概率是多少?

机器算法验证 可能性 生日悖论
2022-04-08 17:34:20

我很好奇一个人在生日那天去世的概率是多少?

我相信有很多方法可以解决这个问题,而且我听说实际数字表明生日的比率更高,因此我在这里问这个问题。

4个回答

抱歉,这里有点新,所以如果这没有太大帮助,请原谅。

美国社会保障局保留出生和死亡记录,并提供可供购买的信息(显然价格不菲):这里

然而,我找到了一个声称已经购买它并免费提供它的来源(以及提供在网站上按日期排序的数据):这里

我假设您可以将其用作样本并使用脚本浏览所有数据,并找出在生日那天实际死去的人数。我自己会这样做,但我还有 20 分钟可以下载(它们大约是 1.5GB),所以如果我有时间写一个脚本,我会尝试自己回复你的统计数据。

美国当然不能代表全世界的人口,但这是一个好的开始。我假设您会因为“第一世界问题”而在生日时看到更高的死亡率,因为我们使用的是美国,我认为这种影响在世界范围内不太明显......

更新 - 数字:D

我已经浏览了免费来源的社会保障死亡主文件,因此无法知道信息是否有效。但是,考虑到它们每个约为 3 GB 的大小,并且没有理由让任何人欺骗这些文件......我会假设它们是有效的。

你可以在这里看到我用来运行它的代码:http: //pastebin.com/9wUFuvpN

它是用 C# 编写的,它会逐行读取死亡索引的行,然后使用正则表达式解析日期。我假设该文件基本上是这种格式:

`(Social Security Number)(First Name)   (LastName)   (Middle Name)    (Some Letter)(MM-DD-YYYY of Death)(MM-DD-YYYY Of Birth)`

我有正则表达式只是选择了出生/死亡日期的最后一部分,检查是否有任何字段只是 0(我假设这意味着社会保障无法获得有效的月份/日期作为记录) ,并丢弃 0。然后它会检查出生日期和出生月份是否与死亡日期/死亡月份相匹配,并将其添加到生日死亡人数中。它会将所有非 0 的记录添加到死亡计数中。

它以这种格式输出结果:

Deaths On Birthday/Total Deaths Lines Looked Through - People With a 0 in any of their record

如果有人可以仔细检查该代码,那就太好了,因为我发现了很多我以前犯过的错误,并且只能说出来,因为我的结果没有统计意义。

这是控制台输出:控制台输出

做一些数学...

  • 文件 1 共有 14879058 人死于生日,其中 44665 人死于生日
  • 文件 2 共有 15278724 人死亡,其中生日有 47060 人死亡
  • 文件 3 共有 15374049 人死亡,其中生日死亡人数为 49289
  • 在 45531831 中,我们总共有 141014 人死于生日。

因此,我们在生日那天死亡的几率约为 0.3097%,而统计数据 (1/365) 会让我们相信在生日那天死亡的几率只有 ~0.27397%。这确实比 1/365 增加了 13% 的生日死亡几率。当然,这个样本仅适用于美国人,只有 4500 万条记录,我敢肯定,最初发表论文的组织可以获得更可靠和更大的死亡指数。但是,我认为在生日那天死亡的可能性比在其他任何一天死亡的可能性更大,这确实是有道理的。

这是一篇时代文章引用了生日死亡原因的跳跃:文章

编辑 2: @cbeleites 指出我忘记计算当天的死亡人数,这将是增加生日死亡人数的一个重要因素。严格来说,我的数据仍然有效,但如果一个人在出生的同一天死亡,我并没有丢弃。有趣的是,我的结果并没有受到这个错误的太大影响,所以这些记录似乎不包括第一天的死亡。我稍后会调查它。我想会有非常有趣的统计数据,我可以在一个月中的几天寻找死亡,并制作某种热图。我可能会在某个时候尝试这样做...

我们可以比@Mike Shi 的数据更精确:所有生日中最危险的生日是第一个

据报道,工业化国家的第一天死亡率约为 0.2%,所有国家的平均死亡率为 0.8%。这意味着在出生当天死亡的风险至少与在接下来的任何一个出生日死亡的风险一样高*。

* 我认为第一天的死亡没有出现在@Mark Shi 的文件中是一个安全的假设,因为据报道美国的第一天死亡率为 0.3%(其他来源:0.26%)。这几乎是社会保障档案中的总出生日死亡率。因此,要么在出生当天死亡的婴儿没有获得社会安全号码,要么在出生当天 > 1 岁死亡是极不可能的。


旁注:
还有其他日子,例如圣诞节和新年前夜,它们的死亡率也高于平均水平

这里有一个论点,为什么生日的死亡概率可能高于其他日子:生日是情绪激动的日子。此外,人们倾向于以某种方式庆祝它。所以有过多的因素(相对于人们通常的生活方式)会增加生物压力(过度情绪、过度饮酒、过度饮食、过度跳舞、过度跳板舞等)。从统计学上讲,这种情况会增加在生日那天死亡的机会,因为它会加剧一个人可能遇到的任何健康问题,或者因为它会使这个人暴露在这个人没有经验的情况和风险中。

新生儿在一年内死亡的概率可以在生命表中找到。例如,您可以查看周期生命表并查看列qx为了x=0人类死亡率数据库中。这并不完全是你想要的,但会给你一个想法。