如何评估 Poisson GLMM、lmer( ) 中的过度离散

机器算法验证 r 咕噜咕噜 过度分散 分散不足
2022-03-24 06:40:49

我有一个具有泊松分布和随机空间块的 GLMM。我的实验设计是 2x2 因子,有 4 个块,总共有 16 个数据点。这是使用 lme4 包的 R 模型规范。

lmer(rich ~ morph*caged + (1|block), 
      family=poisson, data=bexData)

当我在这个对象上调用摘要时,我被返回

   AIC   BIC logLik deviance
 18.58 22.44 -4.288    8.576
Random effects:
 Groups Name        Variance Std.Dev.
 block  (Intercept)  0        0      
Number of obs: 16, groups: block, 4

为简洁起见,我省略了固定效应参数测试和相关性。

以下是我的主要问题:

  1. 你能用这个输出来计算过度分散吗?

    • 我已经读过,过度分散可以计算为剩余偏差除以剩余自由度。那是 8.576 / (16 - 4) 吗?(Zuur 等人,混合效应模型)
  2. 如果此计算正确,则估计量 phi = 0.715。这表明我的数据没有过度分散。

    • 这是否表明存在欠分散?
    • 这是一个问题吗?
    • 任何人都可以就应该对模型进行修正的过度/欠分散阈值提供建议吗?Zuur 在一本书中说过,5 是一个常见的截止点。人们同意这一点吗?
    • 如何进行此类更正?
  3. 我在这里也注意到随机效应的方差为 0。

    • 这是否意味着我的阻塞因子内的数据点之间完全没有误差相关性?
    • 如果是这样,为什么底部所示形式的广义线性模型的 AIC 显着更高,约为 55?
    • AIC 是选择 GLMM 而不是 GLM 的合理方法(如 Zuur 所建议)?

.

glm(rich ~ morph*caged, data=bexData, 
        family=poisson)
1个回答

我的一般偏好是,在将更复杂的模型(此处为 NB)与不太复杂的模型(此处为 Poisson)进行比较时,不依赖任何统计测试,而是运行两者并查看预测值是否存在显着差异。(而“基本上”的含义取决于您所从事的领域)。如果是,那么更喜欢更复杂的模型。如果没有,那就更简单了。

这使我们不依赖于任意的截止;它要求我们运用判断力。在我看来,这些都是好事。