我的主要问题是在进行 I 型(顺序)ANOVA 时如何解释输出(系数、F、P)?
我的具体研究问题有点复杂,所以我将把我的例子分成几部分。首先,如果我对蜘蛛密度 (X1) 对植物生长 (Y1) 的影响感兴趣,并且我在围栏中种植幼苗并操纵蜘蛛密度,那么我可以使用简单的 ANOVA 或线性回归分析数据。那么我是否使用类型 I、II 或 III 平方和 (SS) 来进行 ANOVA 也没关系。就我而言,我有 5 个密度级别的 4 个重复,因此我可以将密度用作一个因素或作为一个连续变量。在这种情况下,我更愿意将其解释为一个连续的独立(预测)变量。在 RI 中可能会运行以下命令:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
希望运行 anova 函数以便稍后进行比较,所以请忽略它的奇怪之处。输出是:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
现在,假设我怀疑我无法控制的土壤中无机氮的起始水平也可能显着影响植物的生长。我对这种影响不是特别感兴趣,但想潜在地解释它引起的变化。真的,我的主要兴趣是蜘蛛密度的影响(假设:蜘蛛密度增加会导致植物生长增加 - 大概是通过减少食草昆虫,但我只是在测试效果而不是机制)。我可以将无机氮的影响添加到我的分析中。
为了我的问题,让我们假设我测试了交互密度*无机 N 并且它不显着,所以我将其从分析中删除并运行以下主要效果:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
现在,我使用 I 型还是 II 型 SS 会有所不同(我知道有些人反对 I 型和 II 型等术语,但鉴于 SAS 的流行,它很容易简称)。R anova{stats} 默认使用 Type I。我可以通过颠倒我的主效应的顺序来计算密度的 II 型 SS、F 和 P,或者我可以使用 John Fox 博士的“汽车”包(应用回归的伴侣)。我更喜欢后一种方法,因为它更容易解决更复杂的问题。
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
我的理解是,II 型假设是,“考虑到(保持常数?)x2 的影响,x1 对 y1 没有线性影响”,对于给定 x1 的 x2 也是如此。我想这就是我感到困惑的地方。与使用 II 型方法的假设相比,ANOVA 使用上述 I 型(顺序)方法检验的假设是什么?
实际上,我的数据要复杂一些,因为我测量了许多植物生长指标以及养分动态和枯枝落叶分解。我的实际分析是这样的:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16