我在我们的培训中看到了以下情况:(数字是转述的)
- 纪元 10 - val 损失 0.0500 - 损失 0.0450
- 时期 11 - val 损失 0.0400 - 损失 0.0400
- 纪元 12 - val 损失 0.0420 - 损失 0.0410
现在显然 11 纪元优于 12 纪元。我假设 13 纪元将从 11 纪元的权重开始,但被告知他们没有。
在我看来,最糟糕的是,我们的训练管道设置了 ReduceLROnPlateau,在 4 个没有改进的 epoch 后降低了学习权重。现在假设 epoch 15 的验证损失为 0.0415,损失为 0.0405,我们可以更好地使用 epoch 11 的权重进行训练。
为什么新的 epoch 不以前一个最佳 epoch 的权重开始?