根据学习曲线选择哪种模型

数据挖掘 交叉验证 过拟合
2022-03-07 17:16:34

我使用不同的回归技术训练了我的模型,但我不确定根据学习曲线选择哪个模型。

1) 我应该选择 Lasso,因为 train 和 CV 在最后收敛 2) 我应该选择 Gradient Boosting,因为 train 和 CV 在中间收敛,并且获得比 Lasso 更低的 RMSE 分数

学习曲线:RMSE 分数与样本数

1个回答

您应该选择具有最低训练和交叉验证 RMSE 的 LightGBM。顺便说一句,分数对于 RMSE 来说是个坏名字,因为您会期望分数越高意味着您的模型越好,但这里恰恰相反。