回归中的 VIF 计算

机器算法验证 回归 物流 多重共线性 方差膨胀因子
2022-03-21 18:45:21

我想使用 VIF 来检查一些序数变量和连续变量之间的多重共线性。当我将一个变量作为因变量而将另一个变量作为独立变量时,回归给出了一个 VIF 值,当我交换这两个变量时,VIF 是不同的。并且一次VIF值大于3,另一次小于3。

那么,我如何决定是否保留变量,我应该保留哪一个?最终,我将在逻辑回归中使用这些变量。在逻辑回归中看到多重共线性有多重要?

1个回答

解决所有解释变量中的多重共线性很重要,因为一组变量(三个或更多)之间可能存在线性相关,但在所有可能的变量对之间没有。

使用方差膨胀因子丢弃解释变量的阈值是主观的。以下是宾夕法尼亚州立大学 (2014)的建议:

VIF 是衡量估计回归系数的方差有多大bk由于模型中预测变量之间存在相关性而“膨胀”。VIF 为 1 表示两者之间没有相关性kth预测变量和剩余的预测变量,因此方差bk根本没有膨胀。一般的经验法则是,超过 4 的 VIF 需要进一步调查,而超过 10 的 VIF 是需要纠正的严重多重共线性的迹象。

请记住始终坚持先前制定的假设以研究变量之间的关系。保留对解释响应变量更有意义的预测变量。

逻辑回归中的多重共线性与其他类型的回归同样重要。请参阅:逻辑回归 - 多重共线性问题/陷阱