我正在拟合逻辑回归模型来预测一组变量的概率。我正在比较两个这样的模型,比如M1
和M2
。唯一的区别是它M2
包括了所有的变量M1
加上几个变量。这个想法是看看哪些变量对预测我的因变量有用。
我预计随着新变量的添加,AUC 应该不会减少。如果新变量具有预测能力,它们应该增加 AUC,如果没有,那么 AUC 应该不受影响。但我发现当我添加一组特定的新变量时,AUC 实际上会降低。这里可能是什么问题?
我predict()
用来获得预测的概率。在计算预测值时,它会自动丢弃所有统计上不显着的变量吗?这可能是AUC下降的原因吗?