泊松分布的原始推导是什么?

机器算法验证 可能性 分布 泊松分布 历史
2022-03-14 02:00:52

我正在学习泊松分布。我理解它,但它的概率质量函数对我来说并不自然。我认为它的概率质量函数似乎来自具有更多上下文的某个地方(或来自一个应用程序)。原始来源在哪里?

2个回答

我认为它首先出现在 Poisson 的“Recherches sur la probabilité des jugements en matière criminelle et en matière Civile”(对刑事和民事案件中判决概率的研究)中。

他没有通过 PMF 定义它,而是将其定义为二项分布的限制(使用他称之为“伯努利定理”的大数定律)

在某个时刻,他获得了公式

P=(1+ω+ω212++ωn12n)eω

对于在有成功概率试验中获得最多次成功的概率(对于 “非常大”)。nμωμμ

这是泊松分布的累积分布函数,参数处评估ωn

你可以在这里看到上面的公式第 206 页(它是法语)。

感谢@Glen-b 和@Xi'an 根据问题中的要求提供历史参考。然而,查看历史参考资料并不总是澄清一个现在熟悉的概念的好方法。古老的语言和设置可能会令人困惑,早期的讨论不会提及澄清后来出现的见解。

也许直观的见解来自比较分布前两个分布可以被认为是二项分布极限的指示,如保持不变。Binom(n=100,p=.2), Binom(n=1000,p=.02),Pois(λ=20).n,μ=λ=np

k = 10:30
pb.100  = round(dbinom(k, 100, .2) ,3)
pb.1000 = round(dbinom(k, 1000, .02), 3)
p.pois =  round(dpois(k, 20), 3)
cbind(k, pb.100, pb.1000, p.pois)

       k pb.100 pb.1000 p.pois
 [1,] 10  0.003   0.006  0.006
 [2,] 11  0.007   0.010  0.011
 [3,] 12  0.013   0.017  0.018
 [4,] 13  0.022   0.027  0.027
 [5,] 14  0.034   0.038  0.039

 [6,] 15  0.048   0.051  0.052
 [7,] 16  0.064   0.065  0.065
 [8,] 17  0.079   0.076  0.076
 [9,] 18  0.091   0.085  0.084
[10,] 19  0.098   0.090  0.089

[11,] 20  0.099   0.090  0.089
[12,] 21  0.095   0.085  0.085
[13,] 22  0.085   0.078  0.077
[14,] 23  0.072   0.067  0.067
[15,] 24  0.058   0.056  0.056

[16,] 25  0.044   0.045  0.045
[17,] 26  0.032   0.034  0.034
[18,] 27  0.022   0.025  0.025
[19,] 28  0.014   0.018  0.018
[20,] 29  0.009   0.012  0.013
[21,] 30  0.005   0.008  0.008

下图的垂直分辨率约为0.0050.01.

在此处输入图像描述

通过 CLT,所有三个离散分布都很好地近似为 但是绘制该密度函数会使图形混乱。Norm(μ=20,σ=20).

图的R代码:

k = 0:35
PB.100  = dbinom(k, 100, .2)
PB.1000 = dbinom(k, 1000, .02)
P.pois  = dpois(k, 20)

hdr = "PDFs of BINOM(100,.2) [blue], 
        BINOM(1000,.02) [cyan], and POIS(20)"
plot(k-.2, PB.100,, type="h", col="blue", 
      ylab="PDF", xlab="x", main=hdr)
lines(k, PB.1000, type="h", col="cyan3")
lines(k+.2, P.pois, type="h")
 abline(h=0, col="green2")