评估树深度的最佳值

数据挖掘 准确性 adaboost
2022-03-13 00:26:35

我正在研究 AdaBoost 模型的性能,我想知道它在树的深度方面的表现如何。

这是深度为 1 的模型的准确度

img2

这里深度为 3

图像

的角度来看,我会说下一个看起来更好,但不知何故我猜上一个更好,因为训练准确性不会消失(过度拟合?)?问题分别。来自随机森林的超参数调整的答案 -选择最佳最大深度强调了我的假设。

1个回答

训练错误不应与测试错误相差太远,否则这是一个高偏差场景,您可能会在生产中处于过度拟合的情况。

但是,通过增加深度可能会出现更高的偏差,但如果您有足够的数据,则不会发生这种情况。

因此,如果您没有大量数据,1 的深度似乎更好,您应该增加训练迭代以降低错误。

除此之外,深度 1 和深度 3 之间的测试结果只有很小的差异。因此,深度 3 的微小好处不值得冒高偏差场景的风险。但也许 2 的最大深度比 1 更好......