为什么我的决策树叶不纯?
数据挖掘
Python
scikit-学习
决策树
2022-03-10 07:59:38
1个回答
使用默认设置,在Scikit 文档DecisionTreeClassifier中描述的复杂性方面没有任何限制。
因此,如果给定节点是纯节点(所有示例具有相同的分类)或没有进一步的属性可以分支,它将停止进一步分支树。
因此,如果您的最终树包含不纯的叶子(对于已对其进行训练的数据集),则该算法没有任何属性可以进一步拆分。
如果您对数据应用任何类型的随机化,例如随机拆分训练和测试数据,当再次拆分并获得不同的训练集时,结果可能会有所不同。
