这个问题显然来自一项不平衡的双向设计的研究,在 R 中使用aov()
函数进行了分析;此页面提供了此问题的更新和详细示例。
对于许多人来说,这个问题的一般答案是:“视情况而定”。这取决于设计是否平衡,如果不平衡,则选择哪种类型的 ANOVA。
首先,要看设计是否平衡。在所有可能的世界中,如果因子设计的所有单元格中的案例数量相同,则无论如何执行 ANOVA,都不会因为将因子输入模型的顺序而产生差异。* 手头的案例,显然来自回顾性临床队列,似乎来自一个没有找到这种平衡的现实世界。所以顺序可能很重要。
其次,它取决于如何执行 ANOVA,这是一个有争议的问题。不平衡设计的 ANOVA 类型在评估主效应和交互作用的顺序上有所不同。评估交互作用是双向和高阶 ANOVA 的基础,因此对于进行的最佳方法存在争议。有关解释和讨论,请参阅此交叉验证页面。请参阅软件包手册中Anova()
(带有大写“A”)功能的详细信息和警告以获得不同的视图。car
在 R中的默认设置下,因子的顺序在不平衡设计中确实aov()
很重要,它使用所谓的 I 型测试。正如当前问题所设想的那样,这些是变量按进入模型的顺序对因素的连续归因。顺序与 R中包中的函数提供的 II 型或 III 型测试无关。但是,这些替代方案在上述链接中具有其自身的潜在缺点。Anova()
car
最后,考虑与 R 中的多元线性回归的关系,lm()
如果包含交互项,它本质上是相同类型的模型。变量的输入顺序与报告lm()
的回归系数和psummary(lm())
值无关,其中 k 级分类因子编码为 (k-1) 个二元虚拟变量,每个虚拟变量报告一个回归系数.
但是,可以使用(R 包中的小写“a” )包装lm()
输出,或者总结每个因素对其所有级别的影响,正如人们在经典 ANOVA 中所期望的那样。那么因素的顺序将与for相关,而与 无关。同样,关于使用哪种类型的 ANOVA 的争议将会再次出现。因此,假设因子输入与模型的所有下游使用顺序无关是不安全的。anova()
stats
Anova()
anova()
aov()
Anova()
lm()
*在所有单元格中进行相同数量的观察就足够了,但据我了解,因素的顺序没有必要无关紧要。要求不高的余额类型可能允许订单独立。