大多数关于如何处理多共线性预测变量的建议都告诉您在拟合模型之前消除它们,使用一些标准,如 VIF(方差膨胀因子)。如果我理解正确,这将消除基于它们在变化上的任何微小差异的预测变量。
我不明白的是,当拟合算法选择一个预测变量而不是其他预测变量时,这比拟合算法所做的更好,也是基于它们之间的微小差异。
最后,预测变量对响应的实际影响将仍然无法区分,因为它们的变化太相似而无法分辨,无论您是先验选择还是让算法去做。
为什么不通过 VIF 跳过先验预测变量选择并直接进行模型选择,这将告诉您具有任何一个共线预测变量的模型将具有相似的 AIC?然后,您可以将效果归因于预测变量的共同点,或者简单地说明无法判断是哪一个导致了响应。