我可能正在处理一个可能已经解决了一百次的问题,但我不确定在哪里可以找到答案。
使用逻辑回归时,给定许多特征并试图预测一个二元分类值,我有兴趣选择预测的特征子集好。
有没有类似于套索的程序可以使用?(我只见过用于线性回归的套索。)
查看拟合模型的系数是否表明不同特征的重要性?
编辑 - 看到一些答案后的澄清:
当我提到拟合系数的大小时,我指的是那些适合归一化(均值 0 和方差 1)特征的系数。否则,正如@probabilityislogic 指出的那样,1000x 似乎不如 x 重要。
我对简单地找到最好的 k 子集(正如 @Davide 提供的那样)不感兴趣,而是权衡不同特征相对于彼此的重要性。例如,一个特征可能是“年龄”,而另一个特征可能是“年龄>30”。它们的增量重要性可能很小,但两者都可能很重要。