当预测变量高度相关时,SHAP(SHapley Additive exPlanations)值是否可能具有误导性?如何以及为什么?如果是这样,是否有关于何时不使用 SHAP 的指导?是否有任何基于的经验法则告诉我们什么时候特征对于 SHAP 来说过于相关?
我对回归设置感兴趣,其中是预测变量(又名特征)的维向量,我们正在使用 SHAP 来理解非线性回归模型的行为允许交互。例如,假设是梯度增强回归树。
动机:
- https://christophm.github.io/interpretable-ml-book/shapley.html#disadvantages-13指出“与许多其他基于排列的解释方法一样,Shapley 值方法在特征相关时会包含不切实际的数据实例. 为了模拟联盟中缺少特征值,我们边缘化特征。这是通过从特征的边缘分布中采样值来实现的。只要特征是独立的,这很好。当特征依赖时,我们可能会采样对这个实例没有意义的特征值。”
- https://youtu.be/B-c8tIgchu0(Scott Lundberg 提供的关于 SHAP 的介绍)触及了这个问题。大约 10 点 50 分,演示者说:“实际上,您经常假设不同输入特征之间的独立性以计算条件期望。”
- https://arxiv.org/abs/1705.07874(Scott Lundberg 和 Su-In Lee 的解释模型预测的统一方法)指出,许多方法在等式 11 中“假设特征独立”。屏幕截图:
编辑: Mase 等人的论文(由红衣主教在下面的评论中链接)与这个问题非常相关:
混合和匹配和的组件存在一些问题。变量和可能在受试者 i = 1, 上显示出强相关性。. . , n. 把和到单个假设点可能会产生一个与以往任何时候都相去甚远的输入组合。除了不寻常之外,某些组合在物理上甚至逻辑上都是不可能的。这些变化可能会产生一个混合数据点,代表收缩压低于舒张压的患者。某人的出生日期可以跟随他们的毕业日期。当医院记录显示血氧的最低、最高和平均水平时,混合点的平均 O2 可能低于最低 O2,或者它可能具有不同的最小值和最大值以及一个变量,表示它们只测量过一次(或从未测量过)。分开理解经度和纬度的影响可能有重要的原因,但有些组合是没有意义的,也许是通过将住宅放置在水体中。当函数是经过训练的,它几乎不会看到任何不可能或极不可能的输入。结果,它的预测不能被适当地规范化。调查人员应该能够选择不依赖任何此类值的重要性度量。