R中xgboost包的SHAP贡献依赖图是什么?

数据挖掘 机器学习 r xgboost
2021-09-16 17:03:40
clf = xgboost(data.matrix(train2), label = train$MACROSOMIA,objective = "binary:logistic", nrounds = 20)
pred = predict(clf, data.matrix(test[, -12]))

xgb.plot.shap(data.matrix(test2), model = clf, plot_loess =TRUE,features= "GESTAC")

这是我的代码,我得到了一个 SHAP 特征对特征值的预测依赖性的贡献。我只是很难理解它。我想知道它是什么?我如何解释它?

这是一个链接你能帮我理解这个情节是什么意思吗?

xgb.plot.shap()
2个回答

关于 SHAP 值的有见地的博客在这里

简而言之,该图显示了 x 轴上每个变量值对预测优势比的贡献。它以一种巧妙的方式解释了与其他预测变量的相互作用和相关性。

这些值不是优势比本身,而是对单个变量的优势比的贡献。总体优势比可能处于非常不同的水平。

这是 xgboost 包的输出

在 y 轴上。这表示对数奇数比。公式为 log(p/1-p)

P/1-PP 代表成功的概率。1- P 代表失败的概率。

当对数奇数比为 0 时,表示奇数为 1。成功概率与失败概率相同。

当对数奇数比小于 0 时,表示成功的概率小于失败的概率。

当对数奇数比大于 0 时,表示成功的概率高于失败的概率。