我正在阅读关于使用权重归一化改进 ANN 学习的论文权重归一化:加速深度神经网络训练的简单重新参数化。
他们考虑标准的人工神经网络,其中每个神经元的计算包括输入特征的加权和,然后是元素非线性
在哪里是一个维权重向量,是一个标量偏差项,是一个输入特征的维向量,表示逐元素非线性和表示神经元的标量输出。
然后他们建议重新参数化每个权重向量就参数向量而言和一个标量参数而是对这些参数执行随机梯度下降。
在哪里是一个维向量,是一个标量,并且表示欧几里得范数. 他们称之为重新参数化权重归一化。
这个标量是什么用于,它来自哪里?是是标准化的重量?一般来说,权重归一化是如何工作的?它背后的直觉是什么?