我无法清楚地区分多元线性回归中的“交互”和“共线性”。对我来说,这些术语是相关的,但并不相同。
我搜索了论坛,但找不到答案。如果你有,请分享你的答案。如果您知道论坛中某处有此类问题的答案,请分享链接。
我无法清楚地区分多元线性回归中的“交互”和“共线性”。对我来说,这些术语是相关的,但并不相同。
我搜索了论坛,但找不到答案。如果你有,请分享你的答案。如果您知道论坛中某处有此类问题的答案,请分享链接。
当考虑三个或更多变量之间的关系时,可能会出现交互作用,并描述了两个变量对第三个变量的同时影响不相加的情况。最常见的是,交互作用是在回归分析的背景下考虑的。
相互作用的存在对统计模型的解释具有重要意义。如果两个感兴趣的变量相互作用,则每个相互作用变量与第三个“因变量”之间的关系取决于另一个相互作用变量的值。在实践中,这使得预测改变变量值的后果变得更加困难,特别是如果它与之交互的变量难以测量或难以控制。
共线性是一种统计现象,其中多元回归模型中的两个或多个预测变量高度相关,这意味着可以以非平凡的准确度从其他变量中线性预测一个。在这种情况下,多元回归的系数估计值可能会随着模型或数据的微小变化而发生不规律的变化。共线性不会降低模型整体的预测能力或可靠性,至少在样本数据本身内是这样;它只影响有关单个预测变量的计算。也就是说,具有相关预测变量的多元回归模型可以表明整个预测变量束对结果变量的预测效果如何,但它可能无法给出关于任何单个预测变量的有效结果,或者关于哪些预测变量相对于其他预测变量是多余的。
底线:交互并不意味着共线性,共线性并不意味着存在交互。
当两个自变量以某种有趣的方式组合时,可以将交互项引入您的模型以解释不同的影响。它们通常在存在分类因素时使用,例如允许不同的响应率(收入)到第二个因素(受教育年限)按分类(性别,0=男性,1=女性)。如果我们简单地回归,该模型仅考虑了女性收入高于或低于男性的固定金额,并有一个单独的术语说明了教育差异,而与性别无关。
如果我们添加第三个交互变量, 所以( _ _成为男性收入变化率的梯度,并且是对女性收入变化斜率的调整)。
这是一种交互,但它不是共线的,因为它的响应方式与整个数据集的教育年限不同(所有男性点都为零)。因此,交互作用与共线性不同,交互作用实际上可以成为回归模型的有用元素。
更一般地,两个变量(都是非常数)的乘积根据定义是非线性的,因此虽然以这种方式创建的交互项可能与两个分量变量相关,但它不是线性相关的,因此共线性是不可能的。
对我来说,“交互”是描述响应者(Y) 如何对预测变量 (X) 的不同级别或级别组合做出反应的术语。例如,Y 是否以 1+1>2 的方式受 X1 和 X2 的影响。它没有描述或指示预测变量之间的依赖关系。而多重共线性是描述预测变量之间这种关系/依赖关系的术语。
交互作用主要应用于双向方差分析,并告诉两个或多个自变量对给定变量的影响,即每个自变量对给定因变量具有相同的影响。其中共线性表示两个或多个自变量之间的相关性或多个不包括因变量的自变量。