lmer
希望这是一个问题,这里有人可以回答我从适合的混合效应模型(来自lme4 R 包)分解平方和的性质。
首先,我应该说我知道使用这种方法存在争议,在实践中,我更有可能使用自举 LRT 来比较模型(正如 Faraway,2006 所建议的那样)。但是,我对如何复制结果感到困惑,所以为了我自己的理智,我想我会在这里问。
基本上,我开始掌握使用适合lme4
包装的混合效果模型。我知道您可以使用该anova()
命令来总结顺序测试模型中的固定效应。据我所知,这就是 Faraway (2006) 所指的“预期均方”方法。我想知道的是如何计算平方和?
我知道我可以从特定模型中获取估计值(使用coef()
),假设它们是固定的,然后使用模型残差的平方和(有和没有感兴趣的因素)进行测试。这对于包含单个主体内因素的模型来说很好。但是,在实施裂区设计时,我得到的平方和值等于 R 使用aov()
适当Error()
名称产生的值。但是,这与模型对象上的命令产生的平方和不同,尽管 F 比率是相同的。anova()
当然,这是完全有道理的,因为混合模型中不需要Error()
地层。但是,这必须意味着在混合模型中以某种方式惩罚平方和,以便提供适当的 F 比率。这是如何实现的?以及模型如何以某种方式纠正图间平方和但不纠正图内平方和。显然,这是通过为不同的效应指定不同的误差值来实现的经典裂区方差分析所必需的,那么混合效应模型如何允许这一点呢?
基本上,我希望能够自己复制anova()
应用于 lmer 模型对象的命令的结果,以验证结果和我的理解,但是,目前我可以通过正常的主题内设计实现这一点,但不能用于拆分-情节设计,我似乎无法找出为什么会这样。
举个例子:
library(faraway)
library(lme4)
data(irrigation)
anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation))
Analysis of Variance Table
Df Sum Sq Mean Sq F value
irrigation 3 1.6605 0.5535 0.3882
variety 1 2.2500 2.2500 1.5782
summary(aov(yield ~ irrigation + variety + Error(field/irrigation), data = irrigation))
Error: field
Df Sum Sq Mean Sq F value Pr(>F)
irrigation 3 40.19 13.40 0.388 0.769
Residuals 4 138.03 34.51
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
variety 1 2.25 2.250 1.578 0.249
Residuals 7 9.98 1.426
从上面可以看出,所有 F 比率都一致。多样性的平方和也一致。然而,灌溉的平方和不一致,但似乎 lmer 的输出是按比例缩放的。那么 anova() 命令实际上做了什么?