平均居中交互项

机器算法验证 回归 相互作用 意思是 多重共线性 定心
2022-04-05 14:07:25

我想在回归模型中将我的交互项居中(即,使每个变量的平均值为零)。我知道我应该首先将我的变量居中,然后将它们相乘以创建我的交互项。但是,当我将两个负分数相乘时,我会得到一个正分数,这是一个问题吗?我一直无法找到一个好的答案。谢谢!

1个回答

不必对包含在交互项中的变量进行均值处理。回到黑暗时代,当人们在精度有限的机械(而非电子)计算器上手动进行统计计算时,首先进行居中可能会有一些实际优势。但现代计算硬件和软件使这变得不必要。弗兰克哈雷尔在这里评论说:“我几乎从不使用居中,发现它完全没有必要且令人困惑。”

但是如果你做居中,你仍然会得到正确的结果,因为你观察到“当我将两个负分相乘时,我将得到一个正分”。

假设所有回归系数(包括交互作用)及其原始尺度中的变量都是正的。然后,双向交互项对最终预测的贡献比任何一个变量单独贡献的贡献更大。

现在假设您将数据居中,并且您会遇到两个预测变量的值均低于其平均值的情况。您仍然希望双向交互对最终预测的贡献比任何一个变量单独贡献的贡献更大。所以他们在互动中的“正分”正是你想要的。不同之处在于,在居中之后,两个预测变量的个体贡献相对于均值居中模型的(新)截距将是负的。

在居中与否之间,与居中变量相互作用的变量的截距和系数将发生变化。但是,中心预测变量的系数不会改变,除非它涉及与另一个中心变量的交互作用。

要看到这一点,请考虑以下线性模型y使用预测器x以平均值为中心x¯并且不居中z

y=β0+β1(xx¯)+β2z+β3(xx¯)z

将不变的术语收集在一起,那些仅随时间变化的术语x, 那些只随着z,以及那些涉及交互的,我们得到:

y=(β0β1x¯)+β1x+(β2β3x¯)z+β3xz

将其与相应的模型进行比较,两者都没有x也不z居中:

y=β0+β1x+β2z+β3xz

所以居中x改变截距和系数z来自未居中的模型,但留下的系数为x并且对于xz交互不变。

报告的系数p值z不居中的和不居中的会有所不同x- 为中心的模型。起初这似乎令人不安,但没关系。对交互作用中涉及的预测变量的显着性的正确检验必须同时涉及其个体系数和交互作用系数,并且该检验的结果不会因居中而改变