非参数双向方差分析的一般方法

机器算法验证 回归 方差分析 非参数
2022-03-16 05:34:14

为几乎像教科书一样的问题道歉。

我有一个具有固定类别和连续响应变量的 2x2 设计。

如果组之间的方差相等(Bartlett 检验)并且残差是正态分布的(Shapiro 检验),那么我可以做标准的 ANOVA。

否则:

  1. 尝试转换数据(例如:arcsin(sqrt),或 log(),甚至 rank())。如果转换后的数据是同方差和正态残差,则进行正态方差分析。

  2. 一种选择:Kruskal 检验(告诉您组间是否有任何均值不同),然后是多对 wilcox 检验(以确定哪种均值不同)。如果所有因素都很重要,那么所有因素(和交互作用都是重要的)。

  3. 另一种选择:使用此处概述的引导方法(置换残差):对于双向模型,是否有等效于 Kruskal Wallis 单向测试的方法?

这个对吗?

2个回答

比例优势序数逻辑模型是 Wilcoxon 和 Kruskal-Wallis 检验的推广,可扩展到多个协变量、交互作用等。它是一种仅使用 Y 等级的半参数方法。它处理连续 Y,创建 k-1 截距其中 k 是唯一 Y 值的数量。

这对我来说听起来不错。不过有一些问题需要考虑:

  1. 在选项 2 中,您需要确保更正 wilcox 检验中的 p 值以进行多重假设检验。R 中的 pairwise.wilcox.test 函数将为您执行此操作。

  2. 根据我的经验,即使引导方法在这里非常好,但如果您所在领域的其他人(例如论文审稿人)不熟悉它,您可能会受到很多批评。

这实际上取决于您所在领域的正常情况,以及分析的目的是什么。如果这项工作是为了一篇论文,并且您所在领域的从业者有一个与此不匹配的数据分析方法,那么使用这种方法可能更容易证明是正确的(即使它是错误的)。例如,在某些领域,“正确”程序只是“使用 ANOVA”。没有执行额外的测试,结果被接受为有效。ANOVA 对于违反正态性也相当稳健,因此在实践中这种方法(尽管过于简单化)效果很好。