随机森林中的“节点大小”指的是什么?

机器算法验证 机器学习 随机森林 装袋
2022-02-06 17:02:16

我不明白节点大小的确切含义。我知道决策节点是什么,但不知道节点大小。

2个回答

决策树通过训练集的递归划分来工作。每个节点t一棵决策树与一组相关联nt训练集中的数据点:

n_t 是每个节点的大小

您可能会nodesize在一些随机森林包中找到该参数,例如R:这是最小节点大小,在上面的示例中,最小节点大小为 10。此参数隐式设置树的深度。

nodesize来自 R 随机森林包

终端节点的最小大小。将此数字设置得更大会导致更小的树木生长(因此需要更少的时间)。请注意,分类 (1) 和回归 (5) 的默认值不同。

在其他包中,您可以直接找到参数depth,例如WEKA

-depth来自 WEKA 随机森林包

树的最大深度,0 表示无限。(默认 0)

尚不清楚节点大小是在“in-bag”采样还是“out-of-bag”错误。如果是在“袋外”抽样中,则限制性稍强。