我正在为 Vision 中的单标签分类任务训练模型。在本次培训中,我使用了所有类的过采样、MixUp 增强以及旋转和二面角变换来增强数据。
发生的情况是,模型在经过 20 个 epoch 的训练后,达到了验证损失(CE损失)和预测验证集中图像标签的准确性。
问题是模型欠拟合。虽然准确率极高,验证损失极低,但训练损失相当高.
我应该在生产中使用这个模型吗?该模型虽然对训练数据欠拟合,但在预测验证集中的标签时达到了非常高的准确率,而且验证损失也极低。
我应该在生产中使用欠拟合模型吗?
这是最后两个时期的样子 -
时代 | train_loss | 有效损失 | 准确性 |
---|---|---|---|
18 | |||
19 |
如果您可能会问,如果模型欠拟合,我在做什么添加增强,但如果我不添加这些增强,模型将开始过度拟合,验证损失和准确性将开始变差。
我不是在问如何让欠拟合消失,我可以通过运行 20 个以上的训练来做到这一点。我在问是否可以在生产中使用这样的模型。