为什么不总是使用广义估计方程 (GEE) 而不是线性混合模型?
我认为这些链接可能会造成一些混乱。我相信关于“不适用于非线性模型”的陈述实际上是指广义线性混合模型(GLMM),例如当响应是二进制或计数时,或者通常在使用非高斯链接函数时;而不是非线性混合模型,例如可以拟合的模型,例如nlme
逻辑增长模型我们将不再有线性预测器。GLMMs 仍然有一个线性预测器,但是很多关于 GLMMs 的文献都谈到它们是非线性模型,由于链接函数,而不是模型本身的函数形式。这不可避免地会导致一些混乱。
所以,通常关于 GEE 与混合模型的争论实际上是关于 GEE 与 GLMM。
GLMM 通常产生以随机效应为条件的估计,而 GEE 对随机效应进行平均以产生边际估计。两者之间的根本区别在于对(固定)效应的这种解释。GEE 产生人口平均效应,而 GLMM 产生受试者特定效应。
因此,当需要边际(总体平均)解释时,确实存在使用 GEE 而不是 GLMM 的论点。当相关结构被错误指定时,GEE 也很有用,因为标准误差是稳健的。另一方面,众所周知,GEE 需要更大的样本量,并且对于随机丢失的数据并不稳健,而 GLMM 通常是这样。最后,GLMMAdaptive
R 中的包可以产生边际估计和条件估计。
GEE 是一种渐近方法,其鲁棒性不如其推导结果。它在小样本中可能不准确,并且不会扩展到多层次的聚类。它假设丢失的数据完全随机丢失,并且对纵向研究中的非随机丢失不稳健。最后,GEE 引入了一种脱节的思维方式,因为不使用完全可能性意味着你不能做贝叶斯 GEE,你只能做常客 GEE。
有完全可能不是 GEE 的边际模型(即不以特定于主题的随机效应为条件的模型)。最古老的例子是增长曲线分析,现在称为广义最小二乘法。这假设具有参数相关结构的多元正态性,我在这里有一个完整的案例研究。但是这种方法不容易扩展到序数和二进制 Y。