没有截距的 Shapley 值(或没有 `expected_value`)

数据挖掘 机器学习 可解释的ai 解释 形状
2021-09-28 04:38:15

我有一个模型,我想通过使用特征贡献来获得它的可解释性。最后,我希望每个特征都有一些贡献,使得贡献的总和等于模型的预测。

一种方法可能是使用 shapley 值。shapley 值及其在shappython 库中的实现的问题在于它还派生了 and expected_value,我将其称为E. 为了获得模型的预测,必须将所有 shapley 值相加,并E. 有没有一种方法可以在不需要E?


我的解决方案

我已经得出了一个解决方案,但我不确定它是否有意义。假设我有功能x1,,xn 具有 shapley 值 ϕ1,,ϕn 对于模型 f. 然后,我有

f(x)=ϕ1++ϕn+Ef(x)=(1+Eϕi)(ϕ1++ϕn)

(通过使用一个简单的数学技巧)。然后,我声称我有 shapley 价值观,ϕ1^,,ϕn^ 在哪里

ϕj^=(1+Eϕi)ϕj

这些值适用于

f(x)=ϕ1^++ϕn^
但是,称它们为沙普利值有意义吗?

任何批评都非常受欢迎。

1个回答

这与拟合线性回归非常相似,不包括截距,我认为他们将面临类似的问题。

具体来说,考虑一个例子 F(X)=1, =1, φ1=1, φ2=-1. 然后你的比例因子是未定义的,试图除以零。好吧,但你不会经常得到如此准确的数字。让我们将它们调整为

F(X)=1, =1, φ1=1.01, φ2=-1.
现在比例因子是 1+1/.01=101, 以便 φ^1=102.01φ^2=-101. 这在当地并不算太糟糕,因为它仍然表明了两个变量在做出这个预测时的相对重要性。但是,如果您想将此与其他点进行比较X(哪里说F(X)=2, φ1=1, φ2=0, 以便φ^1=2, φ^2=0) 事情看起来会很奇怪,并且汇总整个样本的重要性可能会产生误导。

有关与线性回归等的联系,请参阅对 shapley 值的出色描述