对于不平衡设计,不同类型的方差分析平方和的 Tukey 多重比较是否相同

机器算法验证 r 方差分析 平方和 tukey-hsd-测试
2022-03-18 00:14:46

我正在研究不平衡设计的双向方差分析。

对于不平衡设计,方差分析平方和的不同类型(I、II 和 III)的 Tukey 多重比较是否相同。

我正在使用car包进行方差分析,但方差分析函数car包的输出不适用于该TukeyHSD函数。TukeyHSD期望统计信息aov输出

我看过一些帖子建议使用HSD.testfrom the agricolaepackage using the linear model lmlm不接受type平方和的论点。

那么,对于用于 ANOVA 的不同类型的平方和,Tukey 比较是否相同?

下面是示例

代码::(warpbreaks 是 R 中可用的数据集,我正在删除 3 行以使其不平衡)

library(car)
df <- warpbreaks[-c(1:3), ,]
summary.aov(aov(breaks~wool*tension, df)) # wool: p=.058
car::Anova(aov(breaks~wool*tension, df), type="II") # wool: p=.058
car::Anova(aov(breaks~wool*tension, df), type="III") # wool: p<.05

TukeyHSD(aov(breaks~wool*tension, df))

输出::

> summary.aov(aov(breaks~wool*tension, df)) # wool: p=.058
             Df Sum Sq Mean Sq F value   Pr(>F)    
wool          1    327   327.1   2.940 0.093269 .  
tension       2   1954   976.8   8.780 0.000603 ***
wool:tension  2   1257   628.3   5.647 0.006484 ** 
Residuals    45   5006   111.3                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> car::Anova(aov(breaks~wool*tension, df), type="II") # wool: p=.058
Anova Table (Type II tests)

Response: breaks
             Sum Sq Df F value    Pr(>F)    
wool          476.7  1  4.2847 0.0442255 *  
tension      1953.6  2  8.7800 0.0006034 ***
wool:tension 1256.5  2  5.6472 0.0064836 ** 
Residuals    5006.4 45                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> car::Anova(aov(breaks~wool*tension, df), type="III") # wool: p<.05
Anova Table (Type III tests)

Response: breaks
              Sum Sq Df  F value    Pr(>F)    
(Intercept)  14113.5  1 126.8594 1.100e-14 ***
wool          1480.3  1  13.3055 0.0006846 ***
tension       2641.6  2  11.8721 7.236e-05 ***
wool:tension  1256.5  2   5.6472 0.0064836 ** 
Residuals     5006.4 45                       
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> 
> TukeyHSD(aov(breaks~wool*tension, df))
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = breaks ~ wool * tension, data = df)

$wool
         diff       lwr       upr     p adj
B-A -5.074074 -11.03392 0.8857766 0.0932694

$tension
          diff       lwr       upr     p adj
M-L -10.451852 -19.38891 -1.514795 0.0184375
H-L -15.174074 -24.11113 -6.237018 0.0004701
H-M  -4.722222 -13.24337  3.798927 0.3792099

$`wool:tension`
               diff       lwr        upr     p adj
B:L-A:L -20.2777778 -36.82155  -3.734005 0.0084280
A:M-A:L -24.5000000 -41.04377  -7.956227 0.0008625
B:M-A:L -19.7222222 -36.26600  -3.178449 0.0111663
A:H-A:L -23.9444444 -40.48822  -7.400671 0.0011784
B:H-A:L -29.7222222 -46.26600 -13.178449 0.0000407
A:M-B:L  -4.2222222 -19.01942  10.574978 0.9563376
B:M-B:L   0.5555556 -14.24164  15.352756 0.9999974
A:H-B:L  -3.6666667 -18.46387  11.130534 0.9761080
B:H-B:L  -9.4444444 -24.24164   5.352756 0.4157897
B:M-A:M   4.7777778 -10.01942  19.574978 0.9277630
A:H-A:M   0.5555556 -14.24164  15.352756 0.9999974
B:H-A:M  -5.2222222 -20.01942   9.574978 0.8980170
A:H-B:M  -4.2222222 -19.01942  10.574978 0.9563376
B:H-B:M -10.0000000 -24.79720   4.797200 0.3522966
B:H-A:H  -5.7777778 -20.57498   9.019423 0.8521900

由于对于所有三种类型的平方和(类型 I、II 和 III),残差是相同的,因此使用 I 型方差分析模型完成的 Tukeys 比较 TukeyHSD(aov(breaks~wool*tension, df)) 对 II 型和 III 型方差分析仍然有效。

进一步观察:羊毛只有两个水平 A 和 B,因此实际上羊毛的 Tukeys 比较 p 值应该与 ANOVA 结果一致。

来自不同测试的羊毛的 p 值

可以看出,它与 I 型匹配,而与其他两种不匹配。

因此,如果我的 P 阈值为 0.05,II 型和 III 型 ANOVA 表明羊毛是显着的,它与 I 型 ANOVA 和 TukeyHSD 不一致。

是否可以得出结论,Tukey 检验不能使用 R 进行 II 型和 III 型平方和?

0个回答
没有发现任何回复~