我训练过决策树。我还有一张树 ( ) 的图。现在我想看看哪些样本(红色圆圈的)在哪些叶子下面。我正在使用 sklearn 的植入。有什么办法可以把样品放在叶子下面吗??
这里和这里提供了非常好的分析答案。
对我来说,最简单的方法是找到每个样本所属的叶子,然后使用 将数据帧拆分为集群iloc,以进一步分析集群。这可以使用以下方法完成:
iloc
clf.apply(iris.data)
或者
clf.predict(iris.data)
是的, 在拟合模型上使用应用功能。
请参阅文档。
提到的叶子索引与下划线 _tree 对象中的相同(用于可视化)。