数据挖掘 - 评估树深度的最佳值 - 吾爱随笔录

数据挖掘准确性 adaboost

2022-03-13 00:26:35

我正在研究 AdaBoost 模型的性能，我想知道它在树的深度方面的表现如何。

这是深度为 1 的模型的准确度

这里深度为 3

从我的角度来看，我会说下一个看起来更好，但不知何故我猜上一个更好，因为训练准确性不会消失（过度拟合？）？问题分别。来自随机森林的超参数调整的答案 -选择最佳最大深度强调了我的假设。

1个回答

训练错误不应与测试错误相差太远，否则这是一个高偏差场景，您可能会在生产中处于过度拟合的情况。

但是，通过增加深度可能会出现更高的偏差，但如果您有足够的数据，则不会发生这种情况。

因此，如果您没有大量数据，1 的深度似乎更好，您应该增加训练迭代以降低错误。

除此之外，深度 1 和深度 3 之间的测试结果只有很小的差异。因此，深度 3 的微小好处不值得冒高偏差场景的风险。但也许 2 的最大深度比 1 更好......

其它你可能感兴趣的问题