我需要在 R 中进行配对匹配计数回归。
具体来说,我的数据如下所示:
| ID | 暴露 | 发生 | 区域 |
|---|---|---|---|
| 1 | 0 | 7 | 50 |
| 1 | 1 | 5 | 55 |
| 2 | 0 | 6 | 70 |
| 2 | 1 | 8 | 74 |
| 3 | 0 | 4 | 45 |
| 3 | 1 | 9 | 62 |
我需要结果基于每平方英尺(面积)的相对比率,所以我想使用偏移量。
虽然我认为这不会太困难,但我在 Google 搜索中遇到了困难,因为配对匹配的数据经常以二进制结果完成。
你知道一个好的包或能够做到这一点的方法吗?
我需要在 R 中进行配对匹配计数回归。
具体来说,我的数据如下所示:
| ID | 暴露 | 发生 | 区域 |
|---|---|---|---|
| 1 | 0 | 7 | 50 |
| 1 | 1 | 5 | 55 |
| 2 | 0 | 6 | 70 |
| 2 | 1 | 8 | 74 |
| 3 | 0 | 4 | 45 |
| 3 | 1 | 9 | 62 |
我需要结果基于每平方英尺(面积)的相对比率,所以我想使用偏移量。
虽然我认为这不会太困难,但我在 Google 搜索中遇到了困难,因为配对匹配的数据经常以二进制结果完成。
你知道一个好的包或能够做到这一点的方法吗?
您应该能够使用具有计数响应的混合模型(例如 Poisson 或负二项式)来做到这一点:您想要“标准”count-GLM-with-offset 模型,其中跨 ID 的截距随机变化:
其中索引 ID 和索引 ID 内的观察。 表示整体(人口级)截距;表示随机效应,即截距与每组总体水平值的偏差。(大多数混合模型软件会让您估计分布的条件模式,相当于线性混合模型情况下的 BLUP(最佳线性无偏预测器)。)是th 观察(即组),是发生(计数响应)。
如果您指定模型通过受限最大似然拟合(这可能适用于 GLMMglmmTMB和其他一些软件包),则此规范与配对 t 检验完全类似,但使用的是泊松响应而不是高斯响应。如果您使用最大似然法或贝叶斯方法(更常见),它仍然非常接近等效的“配对泊松 t 检验”。
既然你问如何在 R 中做到这一点:在lme4(例如)它会是
glmer(observation ~ exposure + offset(log(area)) + (1|ID),
family = poisson,
data = ...)
类似的模型可以安装许多不同的包/功能,一些具有非常相似的接口(lme4::glmer, glmmTMB::glmmTMB),一些具有不同的接口(GLMMadaptive),一些贝叶斯(MCMCglmm, rstanarm, brms)等。