逻辑回归中自变量之间的多重共线性检验

机器算法验证 回归 物流
2022-03-23 23:50:04

我在构建逻辑回归模型时使用了 10 个自变量。我确信其中一些变量是相关的。谁能告诉我在这种情况下如何检查自变量之间的多重共线性。谢谢!

4个回答

您可以使用任何用于普通回归的方法。因变量与多重共线性问题无关,因此使用逻辑回归或正则回归或其他什么都没关系。

您也可以参考条件索引。大于 30 的值表示在大多数情况下存在近似依赖关系。然后,您可以通过相关矩阵或 durbin watson 检验。

您可以构建一个相关矩阵并寻找高值。如前所述,另一种选择确实是 VIF 值。两者都是相当随意的,并且依赖于经验法则。例如,相关性“危险”的阈值是多少?您可以尝试对相关变量使用因子得分,并检查您的结果(估计)是否对此问题稳健/敏感。祝你好运!

检查相关矩阵是有帮助的,但它不是一个充分的检查,因为当变量放在一起时可能是相关的,但不是成对的。我建议使用加权回归检查回归中的公差或方差膨胀因子诊断,其中权重设置为等于 phat x (1-phat),其中 phat 是从逻辑回归模型中获得的预测值与相同的变量拟合。