是否值得报告小的固定效应R2R2(边缘R2R2), 大模型R2R2(有条件的R2R2)?

机器算法验证 混合模式 解释 lme4-nlme r平方 报告
2022-03-24 02:51:53

在混合模型分析(R 的 lme4 + lmerTest)中,我想分析 3 个预测变量的影响,A比如BC由于是混合模型,因此有两个随机效应Ran1Ran2

Ran1我首先用and构建了一个随机截距模型Ran2,但没有固定术语:

mod.0 <- lmer ( outcome ~ 1 + (1|Ran1) + (1|Ran2), data = mydata)

结果(固定部分)如下:

Fixed effects:
            Estimate Std. Error       df t value Pr(>|t|)    
(Intercept)  2.92381    0.07787 35.28000   37.55   <2e-16 ***

我建立了一个随机截距混合效应模型来解释Ran1Ran2

mod.1 <- lmer ( outcome ~ A + B + C + (1|Ran1) + (1|Ran2), data = mydata)

结果(固定部分)如下:

Fixed effects:
                         Estimate Std. Error         df t value Pr(>|t|)    
 (Intercept)            3.255e+00  8.476e-02  5.000e+01  38.400  < 2e-16 ***
 A                     -1.482e-01  2.639e-02  5.671e+04  -5.617 1.95e-08 ***
 B                      3.495e-01  2.462e-02  5.971e+04  14.195  < 2e-16 ***
 C                     -2.083e-01  1.873e-02  3.942e+04 -11.124  < 2e-16 ***

用以下方法计算R2对于模型:

r2.mer <- function(m) 
{
   lmfit <-  lm(model.response(model.frame(m)) ~ fitted(m))
   summary(lmfit)$r.squared
}

mod.0拥有R2=0.6187513 并且mod.1R2=0.6251295。我们可以看到,通过添加固定项,模型R2变化不大。

我也用了详细的R2比较两个模型并比较边际和条件的计算方法R2https://github.com/jslefche/rsquared.glmer)。

通过运行以下命令:

rsquared.glmm(list(mod.0, mod.1,))

结果如下:

           Class   Family     Link   Marginal Conditional      AIC
1 merModLmerTest gaussian identity 0.00000000   0.5814522 300654.6
2 merModLmerTest gaussian identity 0.00555211   0.5691487 129177.1

结果与前面一致,即对于mod.1,固定项的方差仅占总方差的 0.00555(边际R2).

正如我一开始所说,我有兴趣分析A, B,的效果C如您所见,尽管效果大小(Beta 值)很小,但由于大量观察,效果显着。

在这种情况下,报告它是否有意义A并且C有负面影响(Beta = -0.14 和 -0.21),B 有正面影响(Beta = 0.345),即使是R2这些固定项的值真的很小吗?你对结果有更好的解释吗?

2个回答

有关更多信息关于R2对于混合模型。首先,正如 Nagakawa 和 Schielzeth 所注意到的,使用R2来自混合模型的 OLS 线性模型具有误导性,不应使用。通常,有多种想法如何计算R2对于混合模型,但仍然没有达成共识。对我来说,长川和席尔泽的想法是最有趣的,但是你应该永远记住R2混合模型与线性模型的“方差解释”不同,它只是一个近似值。在其他方法中,您还可以查看Snijders 和 Bosker (1994)进行比较。

混合模型的统计显着性也是有问题的(通常是有问题的),所以我不会太在意它。

至于你的问题,我推荐Gelman and Hill (2007) 的书。首先,他们建议比较混合模型的“效果大小”。在你的情况下边际R2非常小,但您还应该查看“Betas”:如果它们与您的数据方差相比很小,即在模型中包含这种影响不会改变任何估计,您可能会放弃这些影响。另一方面,在回归和混合模型文献中,有多个示例可以在模型中留下“不显着”的影响,而且几乎从来都不是基于简单的经验法则的决定。例如,在您的情况下,AIC 发生了相当大的变化,这表明第二个模型更适合。所以我在这里看不到一个简单的答案,还没有。

当您添加固定效果时,条件 R^2 下降似乎很奇怪。我知道 Nagakawa 和 Schielzeth 谈论过这种事情,但如果添加重要的预测变量会降低条件(即固定 + 随机)R^2,它似乎就没什么用了......