我有一个包含 10 个类的自定义数据集,我正在使用来自 torch-vision 的预训练 resnet18 模型。我可以清楚地看到它是过度拟合的,因为:模型训练了 75 个 epoch,批量大小为 4,从 epoch 30 开始,验证准确度停止增加,训练准确度不断增加。
我为提高泛化性能和减少过拟合所做的事情:
- 我用我的训练数据的计算平均值和标准对我的数据进行了标准化。
- 我添加了随机旋转、随机水平翻转和随机垂直翻转作为数据增强。
以上是所有这些之后的结果,我想不出在不改变模型架构的情况下产生正则化效果的其他正则化技术,这将完全违背预训练网络的目的,我之所以使用它是因为我我的每个班级只有大约 300 张图片。