在所有数据上训练深度学习模型时如何选择最佳模型检查点?

数据挖掘 机器学习 神经网络 深度学习 监督学习 表现
2022-02-18 01:56:27

在为生产训练最终模型时,通常建议对所有可用数据进行训练(训练 + 开发 + 测试),如此所述。

我正在训练一个深度学习模型。我通常会根据保留数据集的性能保存和使用性能最佳的模型检查点。在超参数调优期间,我使用开发集性能来选择给定实验中的最佳检查点。我也有一个未改动的测试集。

对于最终模型,一种选择是在组合的训练集和开发集上进行训练,并使用测试集来选择最佳检查点。但我真正想做的是对所有数据进行训练。但是,如果没有保留集,就不可能确定哪个检查点是最好的。我如何决定部署哪一个?我可以根据早期的实验进行猜测,假设最佳性能将在相似数量的训练迭代后出现,但回顾早期的实验,很明显,最佳性能在训练期间并非始终出现在同一点。

0个回答
没有发现任何回复~