在 Blitzstein's Introduction to Probability中,指出任何两个人生日相同的概率是 1/365。然而,这不就是给定第一人生日,第二人与第一人生日相同的条件概率吗?
难道我不能通过简单地推广没有 n个人生日相同的公式来证明这一点:
并且简单地调用n = 2,这样我就可以将至少有2个人生日相同的概率解释为2个人生日相同的概率?这不会是 1/365。
我的推理有问题吗?
在 Blitzstein's Introduction to Probability中,指出任何两个人生日相同的概率是 1/365。然而,这不就是给定第一人生日,第二人与第一人生日相同的条件概率吗?
难道我不能通过简单地推广没有 n个人生日相同的公式来证明这一点:
并且简单地调用n = 2,这样我就可以将至少有2个人生日相同的概率解释为2个人生日相同的概率?这不会是 1/365。
我的推理有问题吗?
不幸的是,是的,有缺陷。根据你声称的公式,两个人生日相同的概率,当你只有人,是:
因此,您将非零概率归因于不可能的事件。考虑一下这是否是正确的公式,以及您可能对其做出什么样的改变。
一种方法来查找房间中没有生日匹配的概率人们显示在我的第一个评论的维基百科链接中。这是一种稍微不同的编写方式:
在 R 中,这可以如下评估。[在 R 中,0:24是从 0 到 24 的整数列表;类似地用于其他用途:。]
prod((365:(365-24))/365)
[1] 0.4313003
prod(1 - (0:24)/365)
[1] 0.4313003
prod(365:341)/365^25
[1] 0.4313003
所以
您可以使用 R 制作 Wikipedia 文章中的第一个图,如下所示。绿线表示对于 23 人或更多人,至少一场生日比赛的概率超过
n = 1:60
p = numeric(60)
for (i in n) {
q = prod(1 - (0:(i-1))/365)
p[i] = 1 - q
}
plot(n, p)
lines(c(0,23,23), c(.5,.5,0), col="green2")
有些人对匹配发生的概率如此之高感到惊讶。也许他们在想,一个房间里需要 366 人才能 确定一场比赛。但该图显示概率不会随房间大小线性增加。所以在一个只有 60 人的房间里得到一场比赛是“几乎确定的”(概率 0.9941)。而在一个 23 人的房间里,至少有一场比赛的概率在 1/2 以上。
这是这 60 个概率中的一些概率的表格(截断为 30):
cbind(n, p)
n p
[1,] 1 0.000000000
[2,] 2 0.002739726
[3,] 3 0.008204166
[4,] 4 0.016355912
[5,] 5 0.027135574
[6,] 6 0.040462484
[7,] 7 0.056235703
[8,] 8 0.074335292
[9,] 9 0.094623834
[10,] 10 0.116948178
[11,] 11 0.141141378
[12,] 12 0.167024789
[13,] 13 0.194410275
[14,] 14 0.223102512
[15,] 15 0.252901320
[16,] 16 0.283604005
[17,] 17 0.315007665
[18,] 18 0.346911418
[19,] 19 0.379118526
[20,] 20 0.411438384
[21,] 21 0.443688335
[22,] 22 0.475695308
[23,] 23 0.507297234 # first to exceed 1/2
[24,] 24 0.538344258
[25,] 25 0.568699704
[26,] 26 0.598240820
[27,] 27 0.626859282
[28,] 28 0.654461472
[29,] 29 0.680968537
[30,] 30 0.706316243
...
[60,] 60 0.994122661
注释:我同意@Ben (+1) 的观点,即您的方程式无法获得两个随机选择的人之间匹配的概率。然而,假设你在一个房间里的 25 个人中,那么很有可能房间里至少还有一个人会匹配你的生日。
因此,对上述主要生日问题的另一种错误的“直觉”方法是将某人匹配你生日的概率与一些两个(或更多)人匹配生日的更大概率混淆。(在 25 个人中,有对可能有匹配生日的人。)
最后,本问答展示了一种模拟生日匹配概率的方法。稍作修改,该方法也可用于查找预期的匹配数。