我的问题涉及本文中的一个具体陈述:
Schraudolph 和 Graepel 解决了在病态问题的随机设置中,由于(估计的)Hessian 的病态,梯度的采样估计不太可能指向正确的方向。
在第 3 章中,作者声称与 Hessian 的大特征值相关的方向(大曲率方向)可以通过将 Hessian 的随机估计相乘来识别和渐变.
我不明白这个论点。我错过了什么?
我的问题涉及本文中的一个具体陈述:
Schraudolph 和 Graepel 解决了在病态问题的随机设置中,由于(估计的)Hessian 的病态,梯度的采样估计不太可能指向正确的方向。
在第 3 章中,作者声称与 Hessian 的大特征值相关的方向(大曲率方向)可以通过将 Hessian 的随机估计相乘来识别和渐变.
我不明白这个论点。我错过了什么?