我了解使用 Lasso 的优势(例如可扩展性、正则化)。话虽如此,我也知道 Lasso 是一种用于特征选择的近似方法,并且它不一定返回特征的最佳子集(即,将通过或brute-强制搜索)。
鉴于此,我想知道:
在二元分类问题中使用 Lasso 进行特征选择有哪些实际缺点?
有没有一个现实的例子,套索返回的特征子集与真正的最优特征集完全不同?
注意:为了清楚起见,我知道有一个关于Lasso 与逐步回归的相关讨论。我发布新问题而不是在旧论坛中发布的原因是:
- 老问题是关于回归问题
- 旧问题将套索与逐步回归(也是一种近似方法)进行比较。相比之下,我想这是试图将套索( -penalty 正则化)与蛮力( -penalty 正则化)进行比较,这将是最佳的。