我一直认为对anova(myFit)
模型中的每个回归器执行子模型测试(即将模型与所有回归器与没有测试回归器的模型进行比较)。然而,这显然不是真的。
玩具示例:
set.seed(0)
n = 20
data = data.frame(
Y = rbinom(n,20,0.5),
X1 = sample(LETTERS[1:3], n, T),
X2 = rbinom(n,6,0.5)
)
anova(lm(Y ~ X1 + X2, data = data))
# Analysis of Variance Table
# Response: Y
# Df Sum Sq Mean Sq F value Pr(>F)
# X1 2 1.883 0.9413 0.1677 0.8471
# X2 1 3.265 3.2648 0.5817 0.4568
# Residuals 16 89.803 5.6127
anova(lm(Y ~ X2, data = data), lm(Y ~ X1 + X2, data = data))
# Analysis of Variance Table
# Model 1: Y ~ X2
# Model 2: Y ~ X1 + X2
# Res.Df RSS Df Sum of Sq F Pr(>F)
# 1 18 92.908
# 2 16 89.803 2 3.1057 0.2767 0.7619
在第二种情况下,比较 RSS 的变化导致 F(2,16) = 0.2767。在第一种情况下进行什么测试?