我正在训练一个用于图像二元分类的 Squeeze-net 模型。我有 79968 张图像用于训练(50:50 支持和反对),验证集中有 8892 张图像。经过 35000 次迭代后,我的训练精度在 1 到 0.96875 之间波动。验证准确度在 [0.985, 0.986] 之间或多或少是恒定的。基础学习率为 0.01,然后下降到 0.00001。据我所知,视觉训练损失并不完全在两个数字之间波动,但除了一些偶尔的尖峰外,大部分都在 [0.02, 0.09] 范围内。
我的问题是我能从中推断出什么?(1) 过拟合?(2) 模型已经收敛?如果不是我应该降低学习率吗?(3) 模型是否停留在局部最小值?我使用 softmax-with-loss 作为我的损失层。