我正在将特征选择方法 RFE(递归特征消除)从 scikit-learn 应用到数据集。我没有任何预先确定的 RFE 功能数量,我宁愿从数据本身中获取数量。
到目前为止,我为训练数据应用了 1 到 10 的特征数量范围。为了评估,我使用来自 RFE 的特征的预测结果中的 F1。对于序列化,我计划使用提供最佳 F1 的功能数量。
可以使用哪些其他方法来确定 RFE 的特征数量?谢谢!
我正在将特征选择方法 RFE(递归特征消除)从 scikit-learn 应用到数据集。我没有任何预先确定的 RFE 功能数量,我宁愿从数据本身中获取数量。
到目前为止,我为训练数据应用了 1 到 10 的特征数量范围。为了评估,我使用来自 RFE 的特征的预测结果中的 F1。对于序列化,我计划使用提供最佳 F1 的功能数量。
可以使用哪些其他方法来确定 RFE 的特征数量?谢谢!
我鼓励您查看此方法https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFECV.html#sklearn.feature_selection.RFECV,它允许您基于递归测试所有功能您选择的计分方法,包括 F1
一般来说,有3种特征选择方法:
我相信功能选择被完全高估了。但我知道什么?
Soledad Galli 博士在 Udemy 上开设了一个很棒的功能选择课程:
https://www.udemy.com/feature-selection-for-machine-learning/learn/v4/content