是否有将 Hessian 近似为梯度与自身的外积的名称?
如果一个近似于log-loss的Hessian,那么梯度与自身的外积就是Fisher信息矩阵。一般来说呢?
我在解释所谓的高斯-牛顿矩阵假设(Schraudolph, NN (2002). Fasturize matrix-vector products for second-order gradient descent. Neural Computation, 14(7), 1723–38。)。我们有一个输入向量,然后是一个线性变换,然后是一个非线性损失函数。线性变换 (A) 的 Hessian 近似为梯度的外积。假设负对数损失函数 (B) 的 Hessian 矩阵是半正定的。我的问题是假设 A 是什么?