人工智能 - 处理消失梯度问题的具体步骤是什么？ - 吾爱随笔录

我正在训练 ANN 用于 3 个类之间的分类。ANN 有一个输入层、一个隐藏层和一个 3 节点输出层。

我面临的问题是 3 个输出节点产生的输出非常接近 1（至少在前几次迭代中，所以我假设问题也会传播到未来的输出）权重没有更新（或几乎没有更新）由于溢出（大约 $10^{-11}$ ）。我可以解决溢出问题（但我不认为这是罪魁祸首）。我认为如此低的误差值是罪魁祸首，我无法弄清楚是什么导致了如此低的误差值。

什么会导致网络响应更快，也就是说，我将如何真正掌握权重更新，而不是按顺序 $10^{-11}$ ?

数据集包含按顺序排列的值 $10$ 's，随机初始化的权重依次为 $0 < w < 1$ . 我已经尝试过特征规范化，但它不是那么有效。