我有 103 列的数据。我想了解哪种算法最适合特征选择,以及将任何特征称为最佳的逻辑可能是什么。
I run below feature selection algorithms and below is the output:
1) Boruta(given 11 variables as important)
2) RFE(given 7 variables as important)
3) Backward Step Selection(5 variables)
4) Both Step Selection(5 variables)
我无法决定选择哪一个;有了领域知识,我似乎必须从 Boruta 获取结果(因为它提供了大多数变量,而且一切似乎都很重要)。
但是,我没有找到任何具体理由来选择最佳组合。