欠分散数据的准泊松

机器算法验证 r 广义线性模型 造型 泊松回归 分散不足
2022-03-22 08:03:10

与 R相关glm(),我看到一些帖子推荐使用 Conway–Maxwell–Poisson 分布建模欠分散数据,特别是使用 R 包CompGLM,但是,我不确定我是否看到有人确认不能使用准泊松。因此,我问:为什么不对分散不足的数据使用准泊松glm毕竟,准泊松的想法不是超越了方差和均值相等的假设吗?(并且在分散不足的情况下,不相等)。

基本上,我正在运行glm(y ~ x, family=poisson)x 是一个分类变量,我得到

Null deviance: 67.905  on 519  degrees of freedom
Residual deviance: 59.584  on 507  degrees of freedom 

这强烈表明分散不足,因此我倾向于准泊松解决方案。

1个回答

准似然理论对分散不足的数据和过度分散的数据一样有效,所以你可以这样做。

但是,我会小心,上下文很重要。虽然过度分散很常见,并且很容易通过简单的机制来解释,但分散不足的情况并非如此!例如,额外的、未建模的(或未观察到的)变化/不均匀性会导致过度分散,但永远不会产生欠分散。分散不足的原因更难找到,它们通常与缺乏独立性有关。例如,请参阅Poisson 回归中分散不足的原因缺乏独立性的一个常见原因是竞争,我刚刚遇到的一个例子是领地鸟类的数量!

一些处理欠离散建模时的实际问题的帖子是