我正在研究不平衡设计的双向方差分析。
对于不平衡设计,方差分析平方和的不同类型(I、II 和 III)的 Tukey 多重比较是否相同。
我正在使用car
包进行方差分析,但方差分析函数car
包的输出不适用于该TukeyHSD
函数。TukeyHSD
期望统计信息aov
输出。
我看过一些帖子建议使用HSD.test
from the agricolae
package using the linear model lm
。但lm
不接受type
平方和的论点。
那么,对于用于 ANOVA 的不同类型的平方和,Tukey 比较是否相同?
下面是示例
代码::(warpbreaks 是 R 中可用的数据集,我正在删除 3 行以使其不平衡)
library(car)
df <- warpbreaks[-c(1:3), ,]
summary.aov(aov(breaks~wool*tension, df)) # wool: p=.058
car::Anova(aov(breaks~wool*tension, df), type="II") # wool: p=.058
car::Anova(aov(breaks~wool*tension, df), type="III") # wool: p<.05
TukeyHSD(aov(breaks~wool*tension, df))
输出::
> summary.aov(aov(breaks~wool*tension, df)) # wool: p=.058
Df Sum Sq Mean Sq F value Pr(>F)
wool 1 327 327.1 2.940 0.093269 .
tension 2 1954 976.8 8.780 0.000603 ***
wool:tension 2 1257 628.3 5.647 0.006484 **
Residuals 45 5006 111.3
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> car::Anova(aov(breaks~wool*tension, df), type="II") # wool: p=.058
Anova Table (Type II tests)
Response: breaks
Sum Sq Df F value Pr(>F)
wool 476.7 1 4.2847 0.0442255 *
tension 1953.6 2 8.7800 0.0006034 ***
wool:tension 1256.5 2 5.6472 0.0064836 **
Residuals 5006.4 45
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> car::Anova(aov(breaks~wool*tension, df), type="III") # wool: p<.05
Anova Table (Type III tests)
Response: breaks
Sum Sq Df F value Pr(>F)
(Intercept) 14113.5 1 126.8594 1.100e-14 ***
wool 1480.3 1 13.3055 0.0006846 ***
tension 2641.6 2 11.8721 7.236e-05 ***
wool:tension 1256.5 2 5.6472 0.0064836 **
Residuals 5006.4 45
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>
> TukeyHSD(aov(breaks~wool*tension, df))
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = breaks ~ wool * tension, data = df)
$wool
diff lwr upr p adj
B-A -5.074074 -11.03392 0.8857766 0.0932694
$tension
diff lwr upr p adj
M-L -10.451852 -19.38891 -1.514795 0.0184375
H-L -15.174074 -24.11113 -6.237018 0.0004701
H-M -4.722222 -13.24337 3.798927 0.3792099
$`wool:tension`
diff lwr upr p adj
B:L-A:L -20.2777778 -36.82155 -3.734005 0.0084280
A:M-A:L -24.5000000 -41.04377 -7.956227 0.0008625
B:M-A:L -19.7222222 -36.26600 -3.178449 0.0111663
A:H-A:L -23.9444444 -40.48822 -7.400671 0.0011784
B:H-A:L -29.7222222 -46.26600 -13.178449 0.0000407
A:M-B:L -4.2222222 -19.01942 10.574978 0.9563376
B:M-B:L 0.5555556 -14.24164 15.352756 0.9999974
A:H-B:L -3.6666667 -18.46387 11.130534 0.9761080
B:H-B:L -9.4444444 -24.24164 5.352756 0.4157897
B:M-A:M 4.7777778 -10.01942 19.574978 0.9277630
A:H-A:M 0.5555556 -14.24164 15.352756 0.9999974
B:H-A:M -5.2222222 -20.01942 9.574978 0.8980170
A:H-B:M -4.2222222 -19.01942 10.574978 0.9563376
B:H-B:M -10.0000000 -24.79720 4.797200 0.3522966
B:H-A:H -5.7777778 -20.57498 9.019423 0.8521900
由于对于所有三种类型的平方和(类型 I、II 和 III),残差是相同的,因此使用 I 型方差分析模型完成的 Tukeys 比较
TukeyHSD(aov(breaks~wool*tension, df))
对 II 型和 III 型方差分析仍然有效。
进一步观察:羊毛只有两个水平 A 和 B,因此实际上羊毛的 Tukeys 比较 p 值应该与 ANOVA 结果一致。
可以看出,它与 I 型匹配,而与其他两种不匹配。
因此,如果我的 P 阈值为 0.05,II 型和 III 型 ANOVA 表明羊毛是显着的,它与 I 型 ANOVA 和 TukeyHSD 不一致。
是否可以得出结论,Tukey 检验不能使用 R 进行 II 型和 III 型平方和?