什么时候应该使用带有虚拟编码和 ANCOVA 的多元回归?

机器算法验证 回归 多重回归 安乔娃 分类编码
2022-02-03 23:35:45

我最近分析了一个使用 ANCOVA 操纵 2 个分类变量和一个连续变量的实验。然而,一位审稿人建议,将分类变量编码为虚拟变量的多元回归对于分类变量和连续变量的实验来说是更合适的测试。

什么时候使用 ANCOVA 与带有虚拟变量的多元回归比较合适,在这两个测试之间进行选择时我应该考虑哪些因素?

谢谢你。

4个回答

ttnphns 是正确的。

然而,鉴于您的补充意见,我建议审稿人希望更改仅仅是为了解释。如果您想坚持使用 ANOVA 风格的结果,只需将其称为 ANOVA。正如 ttnphns 指出的那样,ANCOVA 和 ANOVA 是相同的。不同之处在于,使用 ANCOVA,您不会将协变量视为预测变量,而且您肯定似乎想要这样做。

审阅者的意思是,虽然您可以对连续预测变量执行 ANOVA,但通常执行回归。其中一个特点是您可以估计连续变量的影响,甚至可以查看它与分类变量之间的交互作用(不包括在 ANCOVA 中,但可能在 ANOVA 中)。

您可能需要一些帮助来解释回归结果,因为如果您要使用 beta 值来确定效果的重要性,那么在交互过程中会发生有趣的事情。

这两个是一回事。例如,在 SPSS 中,我指定 ANCOVA 的过程称为 GLM(一般线性模型);它要求输入“因子”(分类预测变量)和“协变量”(连续预测变量)。如果我将“因子”重新编码为虚拟变量(从每个因子中省略一个冗余类别)并将所有这些与协变量一起输入为 REGRESSION 过程(线性回归)中的“自变量”,我将获得与 GLM 相同的结果(假定因变量是相同的,当然)。

PS 如果模型相同,结果将相同。如果回归只包含主效应,那么 ANCOVA 应该在没有因子交互的情况下指定,当然。

ANCOVA 是一种回归形式,但与其他多元回归技术不同。SPSS 不是足够强大的软件,无法信任某些心理学研究之外的任何东西。在计量经济学、生物学、化学、物理学和金融学中,SPSS 通常并不准确或有用。即使在心理学领域,SPSS 预设回归校正也经常存在问题。

在教育研究中,这里有误用多元回归和 ANCOVA 的例子;它们相似,但说它们相同或几乎相同是 100% 错误的。

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5701329/

正如期刊审稿人所建议的那样,在这种情况下,多元线性回归在我看来比 ANCOVA 更合适。

尝试同时运行多元回归和 ANCOVA,并比较结果。它们可能不会完全相同。

ANCOVA 和多元线性回归相似,但回归更适合强调因结果变量,而 ANCOVA 更适合强调比较来自自变量之一的组。在上述实验中,重点似乎显然是结果变量。

最后,除非你真的确定你做事的方式比审稿人的更好,并且可以解释原因,那么你可能应该承认审稿人的专业知识,这样你才能发表你的论文。