我有一个包含三组任务持续时间值的数据文件,我想确定组对任务持续时间的影响(任务由个人执行;每组有 7 个不同的个人;每个人执行相同的三个任务;以及一个由于实验期间的设置问题,未记录 B 组中的个人)。
我从数据文件创建了以下箱线图(红点是平均值,“n”是每组中时间值的数量):

以及以下直方图(以“分钟:秒”给出的持续时间):

我每组的数据样本很小,“Shapiro-Wilk 正态性检验”告诉我 A 组并非来自正态分布,而 B 组和 C 组来自正态分布。因为组很小并且一组是非正态的,所以我决定运行 Kruskal-Wallis 单向方差分析(非参数),其结果是:
Kruskal-Wallis rank sum test
data: Duration by Group
Kruskal-Wallis chi-squared = 4.2811, df = 2, p-value = 0.1176
所以我应该接受组的影响不显着(p值> 0.05)。
但是,当我运行单向 Anova 时(为了防止 Kruskal-Wallis 不是正确的选择进行完整性检查),Anova 的结果是:
ANOVA Duration ~ Group
Df Sum Sq Mean Sq F value Pr(>F)
Group 2 0.0003692 1.846e-04 6.473 0.00293 **
Residuals 57 0.0016257 2.852e-05
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tukey multiple comparisons of means
95% family-wise confidence level
diff lwr upr p adj
B-A -0.0055763154 -0.009704328 -0.0014483027 0.0054132
C-A -0.0048032407 -0.008769307 -0.0008371744 0.0138750
C-B 0.0007730747 -0.003354938 0.0049010874 0.8943085
也就是说,Anova 返回的 p 值 < 0.05,也就是说,说明组效应是显着的(在这种情况下,A 组在 B 和 C 方面存在显着差异)。
但是,由于每组的样本数量很少,而且一组不是正态分布的,我倾向于接受 Kruskal-Wallis 的结果,但我不确定。
所以我的问题是:
我是否应该接受 Kruskal-Wallis 结果,因为对于这种特殊情况,该测试比 Anova 更充分?
我应该如何使用箱线图和直方图来决定最合适的测试?
谢谢