将 max_depth 设置为大于随机森林中的特征数

机器算法验证 回归 机器学习 随机森林
2022-03-24 01:37:38

我使用随机森林回归来预测房子的价格。数据集中只有 3 个特征。最初,当我设置max_depth=2结果时,结果是高度偏颇的。性能提高了max_depth=8,但我的问题是我们如何设置max_depth大于功能总数。

2个回答

将随机森林(或更具体地说,任何树)的最大深度设置为高于特征数量是没有问题的。

例如,您可以有两个功能,Age并且Sex. 然后你可以进行一系列拆分,首先检查是否Age>18,如果是,检查是否Sex=M,如果是,检查是否Age>40最终结果将是四个叶子/箱子,一个用于Age<=18,一个用于Age>18 & Sex=F,一个用于18<Age<=40 & Sex=M,一个用于Age>40 & Sex=M

树的(决策树/ RF)节点仅根据信息增益或基尼杂质进行拆分。特征的数量不是参数(更准确地说,是超参数)。