记号是什么∇θ大号∇θL意思是?
人工智能
机器学习
强化学习
梯度下降
符号
2021-11-01 17:04:38
1个回答
这是标准的反向传播。您看到的梯度项实际上是一个偏导数向量,其中每个元素是对数似然相对于参数向量的每个元素的偏导数. 因此,它具有相同的维度. 然后用偏导数向量中的相应项更新参数向量的每个元素,这通常是不相同的。