任何两个人生日相同的概率?

机器算法验证 可能性
2022-04-18 23:14:50

在 Blitzstein's Introduction to Probability中,指出任何两个人生日相同的概率是 1/365。然而,这不就是给定第一人生日,第二人与第一人生日相同的条件概率吗?

难道我不能通过简单地推广没有 n个人生日相同的公式来证明这一点:

 P=1(364/365)n

并且简单地调用n = 2,这样我就可以将至少有2个人生日相同的概率解释为2个人生日相同的概率?这不会是 1/365。

我的推理有问题吗?

2个回答

不幸的是,是的,有缺陷。根据你声称的公式,两个人生日相同的概率,当你只有n=1人,是:

P1=1(364365)1=1364365=13650.

因此,您将非零概率归因于不可能的事件。考虑一下这是否是正确的公式,以及您可能对其做出什么样的改变。

一种方法来查找房间中没有生日匹配的概率n=25人们显示在我的第一个评论的维基百科链接中。这是一种稍微不同的编写方式:

P(No Match)=365P2536525=i=024(1i365)=0.4313.

在 R 中,这可以如下评估。[在 R 中,0:24是从 0 到 24 的整数列表;类似地用于其他用途:。]

prod((365:(365-24))/365)
[1] 0.4313003
prod(1 - (0:24)/365)
[1] 0.4313003
prod(365:341)/365^25
[1] 0.4313003

所以P(At least one match)=10.4313=0.5687.

您可以使用 R 制作 Wikipedia 文章中的第一个图,如下所示。绿线表示对于 23 人或更多人,至少一场生日比赛的概率超过1/2.

n = 1:60
p = numeric(60)
for (i in n) {
  q = prod(1 - (0:(i-1))/365)
  p[i] = 1 - q
  }

plot(n, p)
  lines(c(0,23,23), c(.5,.5,0), col="green2")

在此处输入图像描述

有些人对匹配发生的概率如此之高感到惊讶。也许他们在想,一个房间里需要 366 人才能 确定一场比赛。但该图显示概率不会随房间大小线性增加。所以在一个只有 60 人的房间里得到一场比赛是“几乎确定的”(概率 0.9941)。而在一个 23 人的房间里,至少有一场比赛的概率在 1/2 以上。

这是这 60 个概率中的一些概率的表格(截断为 30):

cbind(n, p)
       n           p
 [1,]  1 0.000000000
 [2,]  2 0.002739726
 [3,]  3 0.008204166
 [4,]  4 0.016355912
 [5,]  5 0.027135574
 [6,]  6 0.040462484
 [7,]  7 0.056235703
 [8,]  8 0.074335292
 [9,]  9 0.094623834
[10,] 10 0.116948178
[11,] 11 0.141141378
[12,] 12 0.167024789
[13,] 13 0.194410275
[14,] 14 0.223102512
[15,] 15 0.252901320
[16,] 16 0.283604005
[17,] 17 0.315007665
[18,] 18 0.346911418
[19,] 19 0.379118526
[20,] 20 0.411438384
[21,] 21 0.443688335
[22,] 22 0.475695308
[23,] 23 0.507297234  # first to exceed 1/2
[24,] 24 0.538344258
[25,] 25 0.568699704
[26,] 26 0.598240820
[27,] 27 0.626859282
[28,] 28 0.654461472   
[29,] 29 0.680968537
[30,] 30 0.706316243
 ...
[60,] 60 0.994122661

注释:我同意@Ben (+1) 的观点,即您的方程式无法获得两个随机选择的人之间匹配的概率。然而,假设你在一个房间里的 25 个人中,那么很有可能1(364365)24=0.0637房间里至少还有一个人会匹配你的生日。

因此,对上述主要生日问题的另一种错误的“直觉”方法是将某人匹配你生日的概率与一些两个(或更多)人匹配生日的更大概率混淆。(在 25 个人中,有可能有匹配生日的人。)(252)=300

最后,本问答展示了一种模拟生日匹配概率的方法。稍作修改,该方法也可用于查找预期的匹配数。