允许比较混合效应模型(主要是随机效应)

机器算法验证 r 混合模式 lme4-nlme 似然比
2022-01-20 23:09:42

我一直在研究使用 R 中的 lme4 包进行混合效果建模。我主要使用lmer命令,所以我将通过使用该语法的代码提出我的问题。我想一个普遍的简单问题可能是,比较lmer使用基于相同数据集的似然比构建的任何两个模型是否可以?我相信答案一定是“不”,但我可能是不正确的。我已经阅读了关于随机效应是否必须相同的相互矛盾的信息,以及随机效应的哪个组成部分是什么意思?所以,我将举几个例子。我将使用单词刺激从重复测量数据中获取它们,也许像Baayen (2008)这样的东西在解释中会很有用。

假设我有一个模型,其中有两个固定效应预测器,我们将它们称为 A 和 B,以及一些随机效应......感知它们的单词和主题。我可能会构建一个如下所示的模型。

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(请注意,我故意遗漏了,为了清楚起见data =,我们假设我总是指的是)REML = FALSE

现在,在以下模型中,哪些可以与上述模型的似然比进行比较,哪些不可以?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

我承认对其中一些差异的解释可能是困难的,或者是不可能的。但是,让我们先把它放在一边。我只是想知道这里的变化是否有一些基本的东西排除了比较的可能性。我还想知道 LR 是否还可以,以及 AIC 比较。

2个回答

使用最大似然,这些中的任何一个都可以与 AIC 进行比较;如果固定效果相同 ( m1to m4),则使用 REML 或 ML 都可以,通常首选 REML,但如果它们不同,则只能使用 ML。然而,当固定效应和随机效应都在变化时,解释通常很困难,所以在实践中,大多数人建议一次只改变一个或另一个。

使用似然比检验是可能的,但很麻烦,因为在检验方差分量是否为零时,通常的卡方近似不成立。有关详细信息,请参阅 Aniko 的答案。(感谢 Aniko 比我更仔细地阅读问题并仔细阅读我的原始答案以注意到它错过了这一点。谢谢!)

Pinhiero/Bates 是经典参考;它描述了nlme包装,但理论是相同的。好吧,基本上是一样的;自从写了那本书以来,Doug Bates 改变了他关于推理的建议,新的建议反映在lme4包中。但这比我想进入这里的要多。更易读的参考是 Weiss (2005),Modeling Longitudinal Data。

m在评估方差分量是否为 0 ( vs m- )时,您必须小心使用似然比检验m4,因为典型的卡方近似不适用原因是零假设是,并且它在参数空间的边界上,所以经典结果不适用。σ2=0

在这些情况下,有一个完整的 LRT 分布理论(例如,参见 Self 和 Liang,1987 [1]),但它很快就变得混乱了。对于只有一个参数达到边界的特殊情况(例如mvs m2),似然比具有分布,这实际上意味着您必须将 p 减半-基于的值。12χ12+12χ02χ12

但是,正如@Aaron 所说,许多专家不建议进行这样的似然比测试。潜在的替代方案是信息标准(AIC、BIC 等),或引导 LRT。

[1] Self, SG & Liang, K. 非标准条件下最大似然估计量和似然比检验的渐近特性 J. Amer。统计学家。协会,1987,82,605-610。