treeExplainer 算法直觉

数据挖掘 随机森林 决策树 xgboost 可解释的ai 形状
2022-02-13 16:40:06

我正在阅读有关 treeExplainer的论文;算法 1 的伪代码有点神秘,因为大多数变量甚至都没有定义(与采样和所有涉及的细节相同)。
对算法的工作原理有更直观的解释吗?

1个回答

您所指的论文实际上陈述了以下直觉:

算法 1 估计E[f(X)|do(XS=xS)]通过递归地遵循决策路径x如果拆分功能在S,如果没有分割特征,则取两个分支的加权平均值S.

这似乎是对arxiv 1706.06060中原始描述的轻微修改:

对于树模型E[f(x)|xS]可以使用算法 1 递归估计,其中v是节点值的向量,它取值 internal对于内部节点。向量ab表示每个内部节点的左右节点索引。向量t包含每个内部节点的阈值,并且d是用于在内部节点中分割的特征的索引向量。向量r 表示每个节点的覆盖(有多少数据样本落在该子树中)。

我相信S是 N 个特征的所有子集的集合中的一项。