我正在研究 AdaBoost 模型的性能,我想知道它在树的深度方面的表现如何。
这是深度为 1 的模型的准确度
这里深度为 3
从我的角度来看,我会说下一个看起来更好,但不知何故我猜上一个更好,因为训练准确性不会消失(过度拟合?)?问题分别。来自随机森林的超参数调整的答案 -选择最佳最大深度强调了我的假设。
我正在研究 AdaBoost 模型的性能,我想知道它在树的深度方面的表现如何。
这是深度为 1 的模型的准确度
这里深度为 3
从我的角度来看,我会说下一个看起来更好,但不知何故我猜上一个更好,因为训练准确性不会消失(过度拟合?)?问题分别。来自随机森林的超参数调整的答案 -选择最佳最大深度强调了我的假设。
训练错误不应与测试错误相差太远,否则这是一个高偏差场景,您可能会在生产中处于过度拟合的情况。
但是,通过增加深度可能会出现更高的偏差,但如果您有足够的数据,则不会发生这种情况。
因此,如果您没有大量数据,1 的深度似乎更好,您应该增加训练迭代以降低错误。
除此之外,深度 1 和深度 3 之间的测试结果只有很小的差异。因此,深度 3 的微小好处不值得冒高偏差场景的风险。但也许 2 的最大深度比 1 更好......