机器算法验证 - 平均居中交互项 - 吾爱随笔录

机器算法验证回归相互作用意思是多重共线性定心

2022-04-05 14:07:25

我想在回归模型中将我的交互项居中（即，使每个变量的平均值为零）。我知道我应该首先将我的变量居中，然后将它们相乘以创建我的交互项。但是，当我将两个负分数相乘时，我会得到一个正分数，这是一个问题吗？我一直无法找到一个好的答案。谢谢！

1个回答

您不必对包含在交互项中的变量进行均值处理。回到黑暗时代，当人们在精度有限的机械（而非电子）计算器上手动进行统计计算时，首先进行居中可能会有一些实际优势。但现代计算硬件和软件使这变得不必要。弗兰克哈雷尔在这里评论说：“我几乎从不使用居中，发现它完全没有必要且令人困惑。”

但是如果你做居中，你仍然会得到正确的结果，因为你观察到“当我将两个负分相乘时，我将得到一个正分”。

假设所有回归系数（包括交互作用）及其原始尺度中的变量都是正的。然后，双向交互项对最终预测的贡献比任何一个变量单独贡献的贡献更大。

现在假设您将数据居中，并且您会遇到两个预测变量的值均低于其平均值的情况。您仍然希望双向交互对最终预测的贡献比任何一个变量单独贡献的贡献更大。所以他们在互动中的“正分”正是你想要的。不同之处在于，在居中之后，两个预测变量的个体贡献相对于均值居中模型的（新）截距将是负的。

在居中与否之间，与居中变量相互作用的变量的截距和系数将发生变化。但是，中心预测变量的系数不会改变，除非它涉及与另一个中心变量的交互作用。

要看到这一点，请考虑以下线性模型 $y$ 使用预测器 $x$ 以平均值为中心 $\bar x$ 并且不居中 $z$ ：

y = β_{0} + β_{1} (x - \bar{x}) + β_{2} z + β_{3} (x - \bar{x}) z

$y = \beta_0 +\beta_1(x-\bar x)+\beta_2z+\beta_3(x-\bar x)z$

将不变的术语收集在一起，那些仅随时间变化的术语 $x$ , 那些只随着 $z$ ，以及那些涉及交互的，我们得到：

y = (β_{0} - β_{1} \bar{x}) + β_{1} x + (β_{2} - β_{3} \bar{x}) z + β_{3} x z

$y = (\beta_0 - \beta_1\bar x)+\beta_1 x+ (\beta_2 - \beta_3\bar x)z+\beta_3xz$

将其与相应的模型进行比较，两者都没有 $x$ 也不 $z$ 居中：

y = β_{0}^{'} + β_{1}^{'} x + β_{2}^{'} z + β_{3}^{'} x z

$y=\beta_0' + \beta_1'x+\beta_2'z +\beta_3' xz$

所以居中 $x$ 改变截距和系数 $z$ 来自未居中的模型，但留下的系数为 $x$ 并且对于 $xz$ 交互不变。

报告的系数p值 $z$ 不居中的和不居中的会有所不同 $x$ - 为中心的模型。起初这似乎令人不安，但没关系。对交互作用中涉及的预测变量的显着性的正确检验必须同时涉及其个体系数和交互作用系数，并且该检验的结果不会因居中而改变。

其它你可能感兴趣的问题