自动特征选择包 - Python

数据挖掘 机器学习 深度学习 神经网络 分类 特征选择
2022-02-02 10:47:33

我正在研究一个有 977 行的二进制分类。班级比例为77:23。我有很多高基数分类变量和几个数字变量,例如年龄和数量。

我想知道python中有哪些自动功能选择包。基本上,作为一名数据科学家,了解这个软件包列表将帮助我高效地完成任务。

我遇到了以下

a)这里的Featurewiz

b) sklearn.feature_selection

c) Xverse 这里

d) SHAP-hypertune 这里

我确信还有更多的包可以添加到这个列表中,但我不知道。

我可以请您帮忙列出 python 中的其他自动功能选择包吗?

1个回答

除了这些算法之外,具有高度正则化的 ML 算法还可以进行内在特征选择。这被称为厨房水槽方法。在这种情况下,所有功能都被推送到 ML 模型中,而 ML 模型决定了它对它的重要性。

例如:回归中的 L1 正则化可以在本质上进行特征选择