数据挖掘 - 为什么批量归一化允许我们在神经网络中使用更高的学习率？ - 吾爱随笔录

数据挖掘神经网络深度学习批量标准化

2022-03-14 20:00:32

在文章中，它说：

Using batch normalization allows us to use much higher learning rates, which further increases the speed at which networks train.

任何人都可以分享他们对为什么批量标准化允许更高的学习率的想法吗？谢谢！

1个回答

更高学习率的问题

首先，您需要了解更高学习率的问题。更高的学习率会导致梯度爆炸或消失。换句话说，梯度彼此相乘，因此较低层会经历较高层梯度的复合效应。

批量归一化就是保持所有层的激活归一化，防止它们变得太大或太小。所以这直接有助于防止梯度爆炸/消失。由于这个原因，批量归一化允许更高的学习率。

其它你可能感兴趣的问题