比较两个嵌套混合效应模型时如何解释 ANOVA 输出?

机器算法验证 r 计数数据 lme4-nlme
2022-04-07 16:52:46

我有两个模型(所有变量都是计数变量):

frm.ct <- glmer(frm ~ age + education + socialrole +
              offset(log(words)) + (1|subkorpus), family=negative.binomial(1), 
data=daten.alle.kom)

frm.oage <- glmer(frm ~ education + socialrole +
              offset(log(words)) + (1|subkorpus), family=negative.binomial(1), 
data=daten.alle.kom)

我用它来比较它们:

anova(frm.ct, frm.oage)

在此处输入图像描述

AIC 值告诉我这frm.oage是更好的模型,对吗?但是 0.0452 和 0.8315 是什么意思?

1个回答

Chisq值是应用于两个模型的似然比检验 (LRT) 的检验统计量。该值计算为两个模型的对数似然差异的两倍(对数似然在列中logLik)。渐近地,对数似然比服从卡方分布,其自由度等于两个模型的自由度之差;这是并显示在列中。因此,如果两个模型等效,则观察到与观察到的 ( ) 值一样极端的检验统计量的概率可以从该卡方分布中计算出来。这个概率就是值|67|=1Chi Df0.04520.8315

您可以自己计算为

> pchisq(0.0452, df = 1, lower.tail=FALSE)
[1] 0.8316367

(这不太匹配,因为我使用了打印到控制台的舍入值,而软件将使用更高的精度。)

更实际地说,这只是重申了您对您通过 AIC 制作的两个模型的相对优点的解释。两个模型的对数似然几乎完全相等,表明这两个模型在拟合数据方面做了类似的工作。LRT 告诉您,如果两个模型提供相同的拟合,您很可能会观察到Chisq与报告的统计量一样大的检验统计量 ( )。因此,您无法拒绝两个模型的可能性相等的原假设。

frm.oage是“更好”的,因为它与具有更少参数的更复杂模型一样好。两种型号的 AIC 相差近 2 个 AIC 单位;也就是说,根据 AIC 的定义,如果您在模型中添加了一个没有额外解释能力的冗余参数,您会期望什么

这并不意外。AIC 是根据模型的对数似然计算得出的。两个模型的“拟合”比较的所有指标是它们本质上是相同的。