我正在尝试编写我之前使用 SAS EM 的两类分类 DT 问题。但试图在 Sklearn 中做到这一点。目标变量是一个两类分类变量。但是有一些连续的自变量。在 SAS 中,我可以为每个拆分指定“最大分支数”。所以当它设置为 4 时,一些叶子会分裂成 2,一些叶子会分裂成 4(尤其是对于连续变量)。我在 sklearn 中找不到等效参数。看着“max_leaf-nodes”。但这控制了整个树的“叶子”节点的总数。我相信你们中的一些人可能已经面临同样的情况并且已经找到了解决方案。请帮助/分享。我会很感激的。
如何控制sklearn DT分类器中每个拆分的分支数?
数据挖掘
Python
分类
scikit-学习
决策树
2022-02-23 07:13:33
1个回答
Scikit-learn 使用 CART 算法的优化版本,该算法遵循二进制拆分。您正在寻找的是在节点上进行多路拆分以获取信息。
您应该在 python 中寻找决策树的 C4.5 或 C5.0 实现。
其它你可能感兴趣的问题