有没有办法在 Sklearn 的决策树的每个叶子下获取样本?

数据挖掘 机器学习 Python 分类 scikit-学习 决策树
2021-09-26 20:43:26

我训练过决策树。我还有一张树 ( 在此处输入图像描述) 的图。现在我想看看哪些样本(红色圆圈的)在哪些叶子下面。我正在使用 sklearn 的植入。有什么办法可以把样品放在叶子下面吗??

2个回答

这里这里提供了非常好的分析答案

对我来说,最简单的方法是找到每个样本所属的叶子,然后使用 将数据帧拆分为集群iloc,以进一步分析集群。这可以使用以下方法完成:

clf.apply(iris.data)

或者

clf.predict(iris.data) 

是的,
在拟合模型上使用应用功能。

请参阅文档

提到的叶子索引与下划线 _tree 对象中的相同(用于可视化)。