数据挖掘 - 如何选择拆分决策树的顺序？ - 吾爱随笔录

数据挖掘回归决策树

2022-03-16 16:01:29

我知道决策树沿着每个属性递归地分裂，贪婪地最小化每次分裂时的错误分类/偏差。

但是，属性拆分的顺序是什么？换句话说，对于 N 维的回归树，是什么决定了哪个属性首先被拆分？

1个回答

一种选择是使用一种简单的方法，比如只选择随机属性，或者一次取一个。

另一种选择是在每一步使用度量来决定最能分割数据的属性。不同的树算法应用不同的度量，例如基尼杂质（CART 算法）或信息增益（ID3 和 C4.5 算法）。

您可以在 Wikipedia 上的“决策树学习”条目中阅读这些方法的简要说明。

其它你可能感兴趣的问题