数据挖掘 - 试图通过 CNN 中的正则化来减少过拟合 - 吾爱随笔录

我正在通过重新训练公开可用的初始层来进行迁移学习，没有正则化这里是我的初始参数和结果：

training steps: 20,000
learning rate: 0.075
test accuracy :72.9%
train accuracy for final iteration : 98.0%
val accuracy for final iteration : 75.0%

明显过拟合，所以我尝试了L2 正则化。这是我的参数和结果，迄今为止的最高准确度：

training steps: 40,000
learning rate: 0.1
test accuracy :71.1%
alpha for L2 : 0.00075
train accuracy for final iteration : 91.0%
val accuracy for final iteration : 71.0%

看起来很有希望，所以我决定更进一步，希望获得更好的准确性：

training steps: 80,000
learning rate: 0.075
alpha for L2 : 0.005

走下图：

因为，图表越来越饱和，所以我以 50,000 步退出。

我的问题：

我应该继续它，希望它会变得更好，还是应该尝试其他值（请建议我应该尝试的一些好的参数范围）？或者可能是其他技术，如 L1 正则化或 dropout ？

注意：因为它是真实世界的数据，所以获取新数据会很困难，而且我不能翻转图像来生成新数据，因为方向也是确定输出类标签的一个因素