对二项式广义混合效应模型中特定主题系数的含义感到困惑

机器算法验证 r 混合模式 lme4-nlme 随机效应模型 咕噜咕噜
2022-04-05 18:52:04

在 * A Comparison of Cluster-Specific and Population-Averaged Approaches for Analyzing Correlated Binary Data*中,Neuhas、Kalbfleisch 和 Hauck 状态:

“使用特定于集群的方法,的概率分布被建模为协变量和特定于第个集群的参数YijXijαii

当系数在回归输出中表示为单个系数时,我无法直观地理解这意味着什么。

例如,在这篇文章中提到的分析中,我测试了week治疗中(在每个人的 4 个时间点,4、8、12 和 24 周测量)和实验group(两个水平:安慰剂与活性)对人们猜测他们已被分配到活动组的几率,lme4在 R 包中的二项式广义线性混合效应模型中指定,如下所示:

glmer(guess ~ group * week + (1 | id), 
      data = w24, family = binomial())

此模型中的集群是参与者 ID。固定效应的系数是

Fixed Effects:
    (Intercept)           group2         weekFac2         weekFac3  
        10.2474           5.0411           2.8542          -1.8699  
       weekFac4  group2:weekFac2  group2:weekFac3  group2:weekFac4  
         0.7396           7.8657           0.8067           9.5187

当有多个集群/参与者时,我根本不明白如何获得“特定于第i

2个回答

我同意这可能有点令人困惑。一些作者避免以这种方式设置它。重要的一点是不是单独估计的,而是将它们包含在一个通用模型中,并且通常的假设是它们是正态分布的,具有未知的方差,这要估计的。αi

关注重点:

特定于第个集群的参数αii

并将其翻译成更常见的东西:

yi=Xiβ+Zibi+ϵi,    i=1,...,N

其中是随机效应向量,是第个簇的设计矩阵,然后我们将向量和矩阵组合成向量矩阵,并让模型可以写成biZiiyiXiΣni×1yΣni×mXZ=diag(Z1,...,ZN)

y=Xβ+Zb+ϵ

这是通常的混合模型方程。

本文提出的观点是关于回归系数的条件解释与边际解释。也就是说,由于混合效应逻辑回归中使用的非线性链接函数,固定效应系数具有对随机效应的解释条件。大多数情况下,这不是与个人群体相关的理想解释。您可以在此处此处找到有关此问题的更多信息

相反,在线性混合模型中,因为链接函数是恒等式,所以没有这个问题。