功能选择:我应该混合功能吗?

数据挖掘 分类 scikit-学习 特征选择
2022-02-27 15:08:40

我有一组不同性质的特征(例如,来自 FFT 变换的 300 个特征、1000 个分类特征等等)。但是只有 900 个样本,我正在尝试使用 Lasso 选择重要特征。所以问题是:我应该对特征子集进行不同的特征选择,还是更好地首先连接特征,然后才进行特征选择?

1个回答

让 LASSO 挑选最好的。如果特征高度相关并且您希望将它们作为一个组进行选择,那么也添加一些 L2 正则化。这被称为 Elastic Net 正则化,它是 L1 和 L2 正则化的泛化。除此之外,不要觉得有必要人为地对特征进行分组。