何时停止最终模型训练?

数据挖掘 训练 火炬 过拟合 卡格尔 早停
2022-02-18 11:28:58

假设我正在参加 Kaggle 图像识别比赛。

首先,我创建一个训练/验证拆分并为我的模型找到好的超参数。这里的停止标准是验证损失停止减少并开始增加时,类似于EarlyStoppingKeras 回调。

当我找到合适的超参数时,我想在完整的数据集上训练我的模型,因为我想要在比赛中获得最佳性能。但是现在训练的停止标准是什么?我不再有验证损失来跟踪模型过度拟合。

我能想到的一个策略是在我之前的模型开始过度拟合时记录 epoch 数,并将最终模型训练到这个 epoch 数。例如,在使用验证子集进行训练期间,我的模型在第 15 个 epoch 之后开始过度拟合,因此我将在 15 个 epoch 上训练我的最终模型。

这个策略好不好?我可以在最终模型训练中使用哪些其他停止标准?

0个回答
没有发现任何回复~