我正在学习泊松分布。我理解它,但它的概率质量函数对我来说并不自然。我认为它的概率质量函数似乎来自具有更多上下文的某个地方(或来自一个应用程序)。原始来源在哪里?
泊松分布的原始推导是什么?
机器算法验证
可能性
分布
泊松分布
历史
2022-03-14 02:00:52
2个回答
我认为它首先出现在 Poisson 的“Recherches sur la probabilité des jugements en matière criminelle et en matière Civile”(对刑事和民事案件中判决概率的研究)中。
他没有通过 PMF 定义它,而是将其定义为二项分布的限制(使用他称之为“伯努利定理”的大数定律)
在某个时刻,他获得了公式
对于在有成功概率试验中获得最多次成功的概率(对于 “非常大”)。
这是泊松分布的累积分布函数,参数处评估。
你可以在这里看到上面的公式第 206 页(它是法语)。
感谢@Glen-b 和@Xi'an 根据问题中的要求提供历史参考。然而,查看历史参考资料并不总是澄清一个现在熟悉的概念的好方法。古老的语言和设置可能会令人困惑,早期的讨论不会提及澄清后来出现的见解。
也许直观的见解来自比较分布和 前两个分布可以被认为是二项分布极限的指示,如而 保持不变。
k = 10:30
pb.100 = round(dbinom(k, 100, .2) ,3)
pb.1000 = round(dbinom(k, 1000, .02), 3)
p.pois = round(dpois(k, 20), 3)
cbind(k, pb.100, pb.1000, p.pois)
k pb.100 pb.1000 p.pois
[1,] 10 0.003 0.006 0.006
[2,] 11 0.007 0.010 0.011
[3,] 12 0.013 0.017 0.018
[4,] 13 0.022 0.027 0.027
[5,] 14 0.034 0.038 0.039
[6,] 15 0.048 0.051 0.052
[7,] 16 0.064 0.065 0.065
[8,] 17 0.079 0.076 0.076
[9,] 18 0.091 0.085 0.084
[10,] 19 0.098 0.090 0.089
[11,] 20 0.099 0.090 0.089
[12,] 21 0.095 0.085 0.085
[13,] 22 0.085 0.078 0.077
[14,] 23 0.072 0.067 0.067
[15,] 24 0.058 0.056 0.056
[16,] 25 0.044 0.045 0.045
[17,] 26 0.032 0.034 0.034
[18,] 27 0.022 0.025 0.025
[19,] 28 0.014 0.018 0.018
[20,] 29 0.009 0.012 0.013
[21,] 30 0.005 0.008 0.008
下图的垂直分辨率约为或
通过 CLT,所有三个离散分布都很好地近似为 但是绘制该密度函数会使图形混乱。
图的R代码:
k = 0:35
PB.100 = dbinom(k, 100, .2)
PB.1000 = dbinom(k, 1000, .02)
P.pois = dpois(k, 20)
hdr = "PDFs of BINOM(100,.2) [blue],
BINOM(1000,.02) [cyan], and POIS(20)"
plot(k-.2, PB.100,, type="h", col="blue",
ylab="PDF", xlab="x", main=hdr)
lines(k, PB.1000, type="h", col="cyan3")
lines(k+.2, P.pois, type="h")
abline(h=0, col="green2")
其它你可能感兴趣的问题