随机森林的超参数调整 - 选择最佳最大深度
数据挖掘
随机森林
准确性
过拟合
超参数调整
2022-02-16 05:05:54
1个回答
通常,最大深度参数应保持在较低的值以避免过度拟合:如果树很深,则意味着模型使用更少的实例在更详细的级别创建更多规则。很多时候,其中一些规则是偶然的,即它们与数据中的真实模式不对应。
从训练集和测试集性能之间的巨大差异中可以看出过度拟合。可以观察到,测试集的性能随着深度的前几个值而增加(我猜到大约 5 左右),然后开始下降。所以最佳点(性能和没有过度拟合)是你提到的点,在这一点之后模型是过度拟合的。
图的稳定部分可能是由于另一个参数(例如,每片叶子的最小实例数)阻止了模型的过度拟合。如果模型可以随意过度拟合,它可能会在训练集上达到最大性能,而在测试集上性能非常低。
注意:我很困惑为什么你同时使用准确性和 MAE,通常前者用于分类,后者用于回归。
其它你可能感兴趣的问题


