使用完整数据训练最终模型

数据挖掘 火炬 变压器
2022-02-20 03:14:24

我已经训练了一些 NLP 模型,测量了它们的性能,现在我想创建一个最终模型,用于使用我可用的所有数据进行训练。

我正在从事文本分类工作,并且正在使用带有PyTorch Lightning库的转换器。这里的问题是我找不到如何关闭验证步骤(使用 pytorch 闪电)的示例,并且经过几次谷歌搜索后,我无法找到关于此的讨论。

所以,现在我正在重新考虑并质疑我是否正确思考。在没有验证的情况下使用完整数据集训练生产模型是常见的做法吗?还是我应该只使用我已经训练过的最好的模型?如果是这样,为什么?

1个回答

生产模型的最后一步通常是在使用验证集调整超参数后使用整个集(训练 + 验证)进行训练。差异通常不会太大,因为验证集应该只是数据集的一小部分,但更多的数据总是有帮助的,尤其是对于基于 DL 的模型。

我不熟悉您正在使用的库,但也许您可以将验证数据设置为 0 并忽略它打印的评估。