我应该如何解释使用 REML 的重复测量 ANOVA 表中缺少 ERROR?

机器算法验证 方差分析 重复测量 解释
2022-04-07 20:30:40

我使用与 R 中的 REML 拟合的线性混合效应模型进行了重复测量 ANOVA。当我报告结果时,我将 ANOVA 表输出包括anova(model_object)

anova(O2.rmtest)
              numDF denDF   F-value p-value
(Intercept)       1   131 168.08616  <.0001
mmolO2.L          1   131   8.35259  0.0045
Lake              2   131  13.83037  <.0001
mmolO2.L:Lake     2   131   1.00465  0.3690

该杂志的编辑想知道为什么这张表缺少一个Error术语。

对于此输出中缺少错误术语的正确解释是什么?是否还有其他信息我应该包括在内,以便读者可以正确评估这些结果?

2个回答

ANOVA 是一个奇怪的词,因为它意味着许多不同的东西。当人们用分类预测变量拟合一般线性模型时,他们通常称之为方差分析,他们得到平方和(包括误差平方和)。

来自 ?anova

When given a single argument it produces a table which tests whether the model terms are    
significant.

因此,编辑器期待您从 anova 获得的表格平方和,例如:

> x <- runif(100)
> y <- runif(100)
> anova(lm(y ~ x))
Analysis of Variance Table

Response: y
          Df Sum Sq  Mean Sq F value Pr(>F)
x          1 0.0023 0.002314  0.0303 0.8623
Residuals 98 7.4958 0.076487  

这些平方和应该总和为平方和:

> var(y) * (length(y)-1)
[1] 7.498077

你没有这个,因为你没有做一个一般的线性模型(或者编辑认为的方差分析),所以你没有平方和。

你可以试着解释一下。但在与编辑处理统计问题时,我喜欢走阻力最小的道路,我只想重命名表格。您可以将其称为固定效应的 III 型测试(我认为这就是 SAS 和 SPSS 所称的),或类似“每个预测变量的显着性测试”之类的东西。我还会从中删除截距(除非您真的对此感兴趣),并且我也很想删除 mmolO2.L,如果(正如我假设的那样)您已经在参数估计中拥有它。

您通过最小二乘法求解“经典方差分析”(线性模型),即划分平方和(在解释性因素中)并最小化剩余平方和(无法解释的变化)。ANOVA 表将该分区恢复为模型中的所有组件。

在线性混合模型中,您正在通过最大似然(或最终的 REML)来解决问题,非常松散地说,如果几个假设为真,则通过找到最大化观察数据的概率(其似然性)的参数。

那么,您得到的“ANOVA”表不是平方和的分区,而是模型中的参数列表(对于固定因子),然后是对它们等于零的零假设的 Wald检验. 请参阅?anova.lme(如果您像我怀疑的那样使用lmenlme包的功能)了解它在应用于单个模型时通知您的一些详细信息[顺便说一句,如果应用于两个或更多模型,它将通知您不同的东西,请参见相同的帮助页面]。

如果您summary(model)获得更多信息,包括估计的随机/残差变化(模型中的两个~错误),在描述您的拟合模型时报告可能确实有意义。

[顺便说一句:请务必了解模型中的参数(以及该表中的线)与经典 ANOVA 表中所代表的因素相比代表什么;例如,虚拟或治疗编码在 R 中是默认的]