如何计算泊松分布的置信度?

机器算法验证 泊松分布 置信区间
2022-02-11 11:18:31

想知道我对我的有多大的信心。有人知道为泊松分布设置上下置信水平的方法吗?λ

  • 观察 ( ) = 88n
  • 样本均值 ( ) = 47.18182λ

95% 的置信度会是什么样子?

4个回答

对于泊松,均值和方差都是如果您想要 lambda 附近的置信区间,您可以将标准误差计算为λλ/n

95% 的置信区间是λ^±1.96λ^/n

Patil & Kulkarni(2012 年,“泊松均值的置信区间比较:一些新方面”,REVSTAT - Statistical Journal讨论了计算泊松分布均值置信区间的 19 种不同方法。

除了其他人提供的答案之外,另一种解决此问题的方法是通过基于模型的方法实现的。中心极限定理方法当然是有效的,并且自举估计为小样本和模式错误指定问题提供了很多保护。

为了提高效率,您可以获得更好的置信区间λ通过使用基于回归模型的方法。无需进行推导,但 R 中的简单计算如下所示:

x <- rpois(100, 14)
exp(confint(glm(x ~ 1, family=poisson)))

请注意,这是一个非对称区间估计,因为泊松 glm 的自然参数是对数相对率!这是一个优势,因为计数数据倾向于向右倾斜。

上述方法有一个公式,它是:

exp(logλ^±1nλ^)

这个置信区间是“有效的”,因为它来自泊松数据的自然参数 (log) 尺度上的最大似然估计,并提供比基于计数尺度的置信区间更严格的置信区间,同时保持标称的 95% 覆盖率.

给定泊松分布的观察结果

  • 计数的事件数为 n。
  • 均值 (λ) 和方差 (σ2) 相等。

一步步,

  • 均值的估计λ^=nλ
  • 假设事件的数量足够大(n>20),标准误差是标准差σ,我们也可以估计,

stderr=σ=λn

现在,95% 的置信区间是,

I=λ^±1.96 stderr=n±1.96 n

[编辑]基于问题数据的一些计算,

  • 假设λ问题中指出的已通过外部检查或提供给我们,即,这是一个很好的信息,而不是估计。

    我做出这个假设是因为最初的问题没有提供关于实验或如何获得数据的任何背景信息(这在处理统计数据时至关重要)。

  • 对于特定情况,95% 的置信区间是

I=λ±1.96 stderr=λ±1.96 λ=47.18182±1.96 47.18182[33.72,60.64]

因此,由于测量(n = 88 个事件)95% 置信区间之外,我们得出结论,

  1. 该过程不遵循泊松过程,或者,

  2. λ我们已经给出的不正确。


重要提示:上面第一个接受的答案是错误的,因为它错误地指出泊松观察的标准误差是λ/n. 这是样本均值(调查样本)过程的标准误差。