我正在训练一个修改后的 VGG-16 来对人群密度进行分类(空、低、中、高)。在最后 2 个 FC 层之一之后,在网络的末端添加了 2 个 dropout 层。
网络设置:
训练数据包含 4381 张图像,分为 4 类(空、低、中、高),20% 的训练数据用于验证。测试数据有 2589 张图像。
训练进行了 50 个 epoch。(训练验证准确度在 50 个 epoch 后下降)
lr=0.001,衰减=0.0005,动量=0.9
损失=分类交叉熵
(训练、验证和测试数据)的增强:rescale=1./255,brightness_range=(0.2,0.9),horizontal_flip
使用上述设置,我得到以下结果:
训练评估损失:0.59,准确率:0.77
测试准确度 77.5(正确预测 2007 年,共 2589 次)
对此,我有两个担忧:
我还能做些什么来提高训练和测试的准确性吗?
我怎么知道这是否是我能得到的最佳精度?