与其他参数检验一样,方差分析假设数据符合正态分布。如果您的测量变量不是正态分布的,如果您使用方差分析或其他假设正态性的测试分析数据,则可能会增加假阳性结果的机会。幸运的是,方差分析对偏离正态的适度偏差不是很敏感。使用各种非正态分布的模拟研究表明,这种违反假设的情况对假阳性率的影响不大(Glass et al. 1972, Harwell et al. 1992, Lix et al. 1996)。这是因为当您从总体中抽取大量随机样本时,即使总体不正常,这些样本的均值也大致呈正态分布。
可以测试数据集与正态分布的拟合优度。我不建议您这样做,因为许多显着非正态的数据集非常适合方差分析。
相反,如果你有足够大的数据集,我建议你只看频率直方图。如果它看起来或多或少正常,请继续执行方差分析。如果它看起来像一个被推到一侧的正态分布,就像上面的硫酸盐数据一样,你应该尝试不同的数据转换,看看它们中的任何一个是否使直方图看起来更正常。如果这不起作用,并且数据看起来仍然严重不正常,那么使用 anova 分析数据可能仍然可以。但是,您可能希望使用非参数检验对其进行分析。几乎每个参数统计检验都有一个非参数替代,例如 Kruskal-Wallis 检验而不是单向方差分析,Wilcoxon 符号秩检验而不是配对 t 检验,Spearman 秩相关而不是线性回归。这些非参数检验不假定数据符合正态分布。然而,他们确实假设不同组中的数据具有相同的分布;如果不同的组具有不同的形状分布(例如,一个偏左,另一个偏右),非参数检验可能不会比参数检验好。
参考
- Glass、GV、PD Peckham 和 JR Sanders。1972. 未能满足方差和协方差固定效应分析假设的后果。牧师教育。水库。42:237-288。
- Harwell,MR,EN Rubinstein,WS Hayes 和 CC Olds。1992. 总结蒙特卡洛方法研究的结果:一因素和二因素固定效应方差分析案例。J.教育。统计。17:315-339。
- Lix、LM、JC Keselman 和 HJ Keselman。1996. 重新审视假设违反的后果:对方差 F 检验的单向分析替代方案的定量审查。牧师教育。水库。66:579-619。