R中带有偏移量的配对计数回归?

机器算法验证 r 回归 假设检验 计数数据 抵消
2022-03-29 23:42:38

我需要在 R 中进行配对匹配计数回归。

具体来说,我的数据如下所示:

ID 暴露 发生 区域
1 0 7 50
1 1 5 55
2 0 6 70
2 1 8 74
3 0 4 45
3 1 9 62

我需要结果基于每平方英尺(面积)的相对比率,所以我想使用偏移量。

虽然我认为这不会太困难,但我在 Google 搜索中遇到了困难,因为配对匹配的数据经常以二进制结果完成。

你知道一个好的包或能够做到这一点的方法吗?

1个回答

您应该能够使用具有计数响应的混合模型(例如 Poisson 或负二项式)来做到这一点:您想要“标准”count-GLM-with-offset 模型,其中跨 ID 的截距随机变化:

ηij=β0+bi+β1Eij+log(Aij)biN(0,σb2)OijPoisson(exp(ηij))
其中索引 ID 和索引 ID 内的观察。 表示整体(人口级)截距;表示随机效应,即截距与每组总体水平值的偏差。(大多数混合模型软件会让您估计分布的条件模式相当于线性混合模型情况下的 BLUP(最佳线性无偏预测器)。)ij={1,2}β0bibiAiji,jth 观察(即),是发生(计数响应)。jiOij

如果您指定模型通过受限最大似然拟合(这可能适用于 GLMMglmmTMB和其他一些软件包),则此规范与配对 t 检验完全类似,但使用的是泊松响应而不是高斯响应。如果您使用最大似然法或贝叶斯方法(更常见),它仍然非常接近等效的“配对泊松 t 检验”。

既然你问如何在 R 中做到这一点:在lme4(例如)它会是

glmer(observation ~ exposure + offset(log(area)) + (1|ID),
      family = poisson,
      data = ...)

类似的模型可以安装许多不同的包/功能,一些具有非常相似的接口(lme4::glmer, glmmTMB::glmmTMB),一些具有不同的接口(GLMMadaptive),一些贝叶斯(MCMCglmm, rstanarm, brms)等。