数据挖掘 - 在应用 Lasso 之前是否应该省略高度相关的特征？ - 吾爱随笔录

如果您能告诉我是否应该在使用 Lasso 逻辑回归 ( L1) 进行特征选择之前省略高度相关的特征，我将不胜感激。

事实上，我想使用逻辑回归L1来进行预测和特征选择。然而，我的一些特征是高度相关的，例如，-1 或 0.9。我应该在应用 Lasso 之前忽略它们还是让 Lasso 决定它？

真的，我在 Raschka 先生的书（Python 机器学习）中读到

正则化是处理共线性（特征之间的高度相关性）的非常有用的方法。

然而，这个内核（通过参考Wikipedia）指出，在模型中保留相关特征会对特征选择产生不利影响，但不会影响预测。