为什么我们不简单地使用R2jRj2而不是 VIF?

机器算法验证 方差 多重共线性 方差膨胀因子
2022-03-30 16:21:16

毕竟我们通过来计算 VIF 。VIF 为对应于对我来说,当我应用 VIF 公式时为什么我不能只使用来检测多重共线性?1/(1Rj2)5RJ20.8Rj2Rj2

2个回答

你说的对。我想指出,我们喜欢使用 VIF 的一件事是它与 beta 系数估计的标准误差的关系。我们可以说,标准误差是 MSE(模型周围的总可变性)、(第 k 个变量的可变性)和第 k 个变量的 VIF 的函数. 说 1 的倒数减去部分决定系数的函数会很奇怪。IEs2{Xk}

s2{bk}=MSE(n1)s2{Xk}(VIFk)

当我了解它时,我被告知更大的数字更容易用肉眼识别。我的导师还使用 10 作为截止值,而不是 5。因此,如果您在某种矩阵中有许多 VIF 计算,您将四舍五入到数字,然后用 2 位数字 = 多重共线性。

此外,我认为 VIF 的直觉是我们正在将值更改为指数增长而不是线性增长:0.8、0.85、0.90、0.95 vs 5、6.66、10、20 再次使其更容易识别。

话虽如此,由于存在 1-1 映射,您可以使用R2没有任何改变