我目前正在使用 lightGBM 进行机器学习项目。
当我在训练数据中添加一个特征时,我得到的特征重要性结果lgb.plot_importance(gbm, max_num_features=10)很高,但是添加这个特征会降低 RUC_AUC_score 用于性能评估。
在追求高预测时,我们是否只是放弃了这个功能?或者从理论上讲,在放弃它之前我需要调查的问题很少?
我目前的理解是,light gbm 中的特征重要性显示了在训练数据时该特征发生了多少次分割,因此并不一定意味着高特征重要性总是会带来更好的性能。因此,在上述情况下,我可以根据评估分数的下降来放弃该功能。
我一直在思考这个问题几天,仍然可以自己得出一个可靠的结论。如果我的任何想法是错误的,请告诉我。
谢谢。