假设一个模型是在日期训练的 使用可用的标记数据,分为训练和测试,即 , . 然后将该模型部署到生产环境中,并对新的传入数据进行预测。一些 几天过去了,在这之间收集了一堆带标签的数据 和 天,让我们称之为 . 在我目前的方法中,我从 (例如 80/20 拆分),
所以, 的 = (用于微调训练的现有模型的新数据 ) 的 = (新数据添加到 )
随着时间的推移,这种微调过程会不断重复。
通过这样做,我得到了一个不断扩展的测试集,并且我阻止了重新训练整个模型(基本上我可以丢弃旧数据,因为模型已经从中学习)。生成的新模型只是旧模型的微调版本。
关于这种方法,我有一些问题:
- 这样做有什么明显的缺点吗?
- 一段时间后,模型是否需要完全重新训练(忘记之前学过的所有内容,并使用新的训练/测试拆分训练模型),还是我上面描述的方法可以无限期地继续下去?
- 用新的微调模型交换现有部署模型的条件应该是什么?