Xgboost(分类问题)每个输入的特征重要性不适用于模型

数据挖掘 机器学习 预测建模 xgboost 特征工程
2022-02-17 13:23:55

我已经为分类问题训练了一个 xgboost 模型。我能够得到模型的特征重要性,如下所示。

http://machinelearningmastery.com/feature-importance-and-feature-selection-with-xgboost-in-python/

但我想获得每个输入的特征重要性。基本上,一个输入可能会给我一个输出概率 0.9,另一个输入可能给我一个输出概率 0.1。我想知道是因为哪些特征(带有值)给了我 0.9 的概率?哪些特征(带有值)给了我 0.1 的概率?

我该如何处理?有这个包吗?

1个回答

部分依赖图可能是您所追求的:这些图显示了概率和输入变量之间的关系。R 中的 mlr 包负责处理这个问题。

关于 XGBoost Git 部分依赖的讨论:https ://github.com/dmlc/xgboost/issues/486

使用 mlr 的通用教程:https ://mlr-org.github.io/mlr-tutorial/devel/html/partial_dependence/index.html