使用 SHAP 获得积极影响的特征

数据挖掘 特征 形状
2022-02-22 16:24:38

我正在尝试使用 SHAP 自动提取对我的回归模型有积极影响的特征名称。例如,在检查代码时,我看到条形图通过获取特征的平均绝对 SHAP 值来确定这些。作为一个绝对值,它显然会产生绝对影响,但我只想考虑积极影响的值。

我的直觉是我可以只取平均值而不是绝对值的平均值吗?(高度)负 SHAP 值应给出负平均值。

这是一个好方法还是我错过了一些更好的方法来做到这一点?

编辑:我对提高预测值的功能特别感兴趣。IE。如果feature_1将预测值提高 100 和feature_21000,我希望将这些信息按原样提取,feature_2并对输出值产生更大的影响。

1个回答

根据您的模型,可能有一些比 SHAP 更好的特定于模型的方法。同样重要的是要注意,SHAP 是 Shapley 值的近似值,主要假设是您的特征之间没有太多相关性。

话虽如此,取平均值而不是平均绝对值似乎是保持您正在做的事情连续性的最有效方法。请记住:

  • 就对输出的直接影响而言,SHAP 没有“物理”解释。对于现实生活中的用户来说,它可能缺乏一些意义。

  • 取平均值可以“隐藏”倾斜的 SHAP 配置文件:对一小部分实例影响较大且对其余实例没有影响的变量可能与对每个实例影响较小的变量获得相同的平均值。