ANOVA 对违反正态性的鲁棒性如何?

机器算法验证 方差分析 重复测量 正态假设
2022-03-24 22:45:17

我有几个非正态分布的因变量:Kolmogorov-Smirnov 检验显着,某些变量的偏度范围高达 8,峰度通常约为 2,但在某些情况下会增加到 12!它是正态分布变量的重复测量 (RM) ANOVA 模型。

几个问题:

  1. 当每组有相同数量的观察时,RM ANOVA 对违反正态性的鲁棒性如何?
  2. 如果我使用非参数测试,我是否需要纠正影响 1 类错误的多个测试?
3个回答

不要把它看成一个二元的东西:“要么我可以相信结果,要么我不能。” 把它看成一个光谱。在完全满足所有假设的情况下(包括在大多数情况下至关重要的随机抽样之一),F值和p值等统计数据将使您能够做出准确的样本到总体推断。离这种情况越远,人们就越应该对这种结果持怀疑态度。你有很大程度的非正态性;这是对准确性的一次打击。现在使用 ANOVA 的其他假设怎么样?尽你所能调整大小,并在脚注或技术部分中记录你发现的内容。正如@William 指出的那样,您还应该查看此页面。

至于你的最后一个问题,我认为你不需要仅仅因为你从参数测试转向非参数测试就改变你的策略来进行多重比较。如果您想描述当前方法的基本原理,我相信人们会很乐意对此发表评论。

让我声明几件事。首先,我认为最好将重复测量方差分析理解为变相的多层次模型,这可能会在这里产生额外的复杂性。我应该让一位更擅长多层次模型的 CV 贡献者来解决这个问题。

但是,一般而言,值得注意的是,并非所有假设都是平等的。人们倾向于认为常态假设是至关重要的,而我认为它是最不重要的。异质性是一个更大的问题。偏斜可能比峰态更具破坏性,但如果它不是太大,并且所有组都向同一方向倾斜,它可能不会致命。基本上,残差是否正常与 p 值是否准确有关,但参数估计值应保持无偏。另一方面,方差的异质性与 OLS 估计器的效率有关。

我的理解是,包括重复测量在内的方差分析对于违反错误假设的正态性具有鲁棒性。然而,有迹象表明,误差在不同因子水平上的变化应该是相等的。

我可以相信非正态分布 DV 的方差分析结果吗?