我已经使用 RMSProp、AdaGrad、Momentum 和 Adam 等优化器训练了我的神经网络模型。
目前,在运行代码之后,我已经打印出了每个 epoch 的训练和测试精度(在我的例子中是 50)。但是,我想知道我应该如何确定这些优化器中哪个性能最好?
在最后一个 epoch更高的训练准确度是否决定了哪个是最好的,或者更高的测试准确度会这样做吗?此外,我观察到,在使用 Momentum 优化器时,与其他优化器相比,模型训练的准确度在第 16 个时期达到了最高的 0.91 左右。
因此,这是否会得出 Momentum 优化器在这种情况下表现最佳的结论?