如何判断梯度是否消失?
数据挖掘
深度学习
梯度下降
火炬
2022-02-24 14:11:55
1个回答
消失梯度是在每个训练批次之后对层上的权重(而不是权重本身)的更新。
您应该在单个批次后检查最顶层和最低层之间的更新信号。
消失梯度是在每个训练批次之后对层上的权重(而不是权重本身)的更新。
您应该在单个批次后检查最顶层和最低层之间的更新信号。