是否有可能通过此图表在模型之间进行过拟合欠拟合比较?(家庭作业)

数据挖掘 机器学习 随机森林 数据科学模型 模型选择 助推
2022-03-07 19:08:36

我试图解释这个图表。

我不确定如何解释这一点,因为,我认为例如 LGBM 验证错误的事实很广泛并且类似于火车箱线图,没有过度拟合的问题,但是当我看到另一种类型的执行图表时LGBM,我可以看到 LGBM 确实过拟合,所以我真的不知道如何正确解释这一点。

在此处输入图像描述

但我不知道如何解释:

LightGBM 可能是最好的选择,因为它更快,并且最终你可以获得足够的准确度,并且与其他两个相比,bagging 的过拟合更少,因为误差之间的差异更小。

任何的想法?

谢谢

1个回答

您的图表似乎表明轻型 GBM 模型在 F1 分数方面非常不一致。其他两种类型的模型的验证准确度往往低于训练准确度,这表明在某种程度上发生了过度拟合(但这在机器学习中无处不在,因此无论如何它都不会破坏交易)。最好的中值验证性能来自 RandomForest,但是一些异常值的性能不如使用 bagging 的模型。一个好的方法可能是拥有一组 RandomForest 模型。