数据挖掘 - treeExplainer 算法直觉 - 吾爱随笔录

treeExplainer 算法直觉

数据挖掘随机森林决策树 xgboost 可解释的ai 形状

2022-02-13 16:40:06

我正在阅读有关 treeExplainer的论文；算法 1 的伪代码有点神秘，因为大多数变量甚至都没有定义（与采样和所有涉及的细节相同）。
对算法的工作原理有更直观的解释吗？

1个回答

您所指的论文实际上陈述了以下直觉：

算法 1 估计 $E[f(X)|do(X_S = x_S )]$ 通过递归地遵循决策路径 $x$ 如果拆分功能在 $S$ ，如果没有分割特征，则取两个分支的加权平均值 $S$ .

这似乎是对arxiv 1706.06060中原始描述的轻微修改：

对于树模型 $E[f(x) | x_S]$ 可以使用算法 1 递归估计，其中 $v$ 是节点值的向量，它取值 $internal$ 对于内部节点。向量 $a$ 和 $b$ 表示每个内部节点的左右节点索引。向量 $t$ 包含每个内部节点的阈值，并且 $d$ 是用于在内部节点中分割的特征的索引向量。向量 $r$ 表示每个节点的覆盖（有多少数据样本落在该子树中）。

我相信 $S$ 是 N 个特征的所有子集的集合中的一项。

其它你可能感兴趣的问题

上一篇关于分类交叉熵的混淆下一篇GAN 损失函数符号说明