确定 RFE 特征数量的最佳方法(递归特征消除)

数据挖掘 特征选择
2022-02-26 01:26:02

我正在将特征选择方法 RFE(递归特征消除)从 scikit-learn 应用到数据集。我没有任何预先确定的 RFE 功能数量,我宁愿从数据本身中获取数量。

到目前为止,我为训练数据应用了 1 到 10 的特征数量范围。为了评估,我使用来自 RFE 的特征的预测结果中的 F1。对于序列化,我计划使用提供最佳 F1 的功能数量。

可以使用哪些其他方法来确定 RFE 的特征数量?谢谢!

2个回答

我鼓励您查看此方法https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFECV.html#sklearn.feature_selection.RFECV,它允许您基于递归测试所有功能您选择的计分方法,包括 F1

一般来说,有3种特征选择方法:

  • 过滤方法
  • 包装方法
  • 嵌入式方法

我相信功能选择被完全高估了。但我知道什么?

Soledad Galli 博士在 Udemy 上开设了一个很棒的功能选择课程:

https://www.udemy.com/feature-selection-for-machine-learning/learn/v4/content