我正在尝试使用 XGRegressor() 进行特征选择。我这样做是因为我有超过 4,000 种功能可供选择。一旦我有了一组特征,我就创建了一个神经网络来使用这些特征来预测 median_gross_rent。
我的问题如下,我有这些特征的重要分数来自
feature_important = model.get_booster().get_score(importance_type='weight')
keys = list(feature_important.keys())
values = list(feature_important.values())
feat_imp_df = pd.DataFrame(data=values, index=keys, columns=["score"]).sort_values(by = "score", ascending=False)
我应该设置一个阈值分数以进行截止吗?在确定要使用的大量特征时,特征选择的最佳实践是什么?谢谢!
