我试图使用Shapley value方法来理解模型预测。我正在Xgboost模型上尝试这个。我的情节如下所示
有人可以帮我解释一下吗?或者确认我的理解是正确的?
我的解释
1)高值Feature 5(由玫瑰色/紫色组合表示) - 导致预测 1
2)低值Feature 5(用蓝色表示) - 导致预测 0
3)Feature 1步骤 1 和 2也适用
4)低值Feature 6导致预测 1 和高值Feature 6导致预测 0
5)低值Feature 8导致预测 1 和高值Feature 8导致预测 1 也是如此。如果它太极端的 x 轴(意思是从 x(1,2) 或 x(2,3) - 这意味着这个特征的低值(在这种情况下)的影响,对预测有很大的影响 1 。 我对吗?
6)无论重要性/影响如何,为什么我在情节中看不到我所有的 45 个特征。no color当它们不重要时,我不应该看到吗?为什么我只看到大约 12-14 个特征?
7)Feature 43 , Feature 55,Feature 14在预测输出中起什么作用?
8)为什么 SHAP 值范围为-2,2?
有人可以帮我弄这个吗?
