CNN 中的振荡损失

数据挖掘 神经网络 卷积神经网络
2021-10-03 07:06:14

所以我设计了自己的 CNN,它有 10 层卷积,没有 maxpooling 或任何其他连接。当我在一个数据集上运行它时,我得到了以下损失曲线(蓝色),另一个是准确率与时代数的关系。您认为这里可能存在什么问题?以及如何纠正它? 在此处输入图像描述

注意:由于缺乏计算资源,我的数据集大小为 20,因此振荡可能看起来更突出或首先发生。

1个回答

振荡损失可归因于以下任一原因:

  1. 学习率:降低学习率,使梯度下降不会超过最小值。
  2. 优化器:选择ADAM 优化器而不是 SGD 等其他优化器。它运作良好。