如果交互项在方差分析中显着,为什么我们不解释主效应?

机器算法验证 方差分析 广义线性模型 相互作用
2022-03-20 07:04:30

我正在阅读关于双向 ANOVA 的在线指南,它在这里说,如果交互项很重要,我们不会解释主要影响。https://online.stat.psu.edu/stat502/lesson/4/4.1/4.1.1
在此处输入图像描述

为什么会这样?我们会不会将主效应的系数与交互项的系数结合起来进行最终解释?例如,我们能不能说,给定因子 2 是 _____,因子 1 与总均值的偏差是 ______。通过将这两项相加,您可以获得与总平均值的最终偏差。

谢谢!

2个回答

假设我们有如下回归关系:

y=β0+β1X+β2Z+β3X×Z+ε

如果没有交互项,即,我们可以像往常一样解释主效应:“保留其他变量,改变中的一个单位与单位相关联 "。y=β0+β1X+β2Z+εXβ1Y

如果存在交互项,则不是这样。这是因为的影响取决于的值(通过相互作用)。事实上,我们可以将第一个公式改写如下:XZ

y=β0+β2Z+(β1+β3Z)X+ε

现在我们看到的系数是固定在一个已知值之后,我们可以像往常一样例如,当时,效果由请注意的重要性并不能保证的显着影响()。在这种情况下,我们需要测试这些系数的总和。X(β1+β3Z)ZXZ=1β1+β3β1β3XZ=1

这在 John Fox 的书Applied Regression Analysis and Generalized Linear Models或 Weisberg 的Applied Linear Regression的第 8 章中得到了很好的讨论。两者都强调您的问题与 Nelder (1977)的边际原则有关

以这最后一本书为例:

我们在本书中采用的测试方法遵循 Nelder (1977) 提出的边际原则。低阶项(例如 A 主效应)从未在包含其任何高阶相关项(如 A:B、A:C 或 A:B:C)的模型中进行测试。[...] 根据边际原则得出的方差分析表不幸地称为 II 型方差分析。[...] III 型方差分析违反了边际原则。它计算为每个其他回归器调整的每个回归器的测试;因此,例如,A 主效应的检验将包括交互作用 A:B、A:C 和 A:B:C。

关键是,对于“II 型”ANOVA,基于此分解中使用的平方和的检验仅在不存在交互作用时才有效(即,确实检验主效应)。F

III 型方差分析允许在所有情况下测试主效应,但确实提出了不同的研究问题,不应随意使用。

然而,作为一个直观的答案,当交互项显着时不解释主效应的想法可能如下:如果 A:B 显着,那么 A 和 B确实在该过程中发挥重要作用。此外,在我们可以观察到复杂交互模式的许多情况下,询问 A 和 B 的主效应可能毫无意义,因为 A 的表达过于依赖 B 的表达。(例如,让我们想象一种肥料会仅在非常潮湿的土壤上增加产量,但这会大大降低干燥土壤的产量。会有很强的相互作用肥料:灌溉,但谈论这种肥料的“主要作用”会很棘手:这完全取决于太多浇水时。)