我正在尝试在凸函数上使用梯度上升法,例如相对于其参数的多元正态密度函数(原始函数有点复杂),类似于最大似然估计。
我想知道如果我对步长使用恒定值,即 ,梯度上升方法是否会出现异常。
另外,如果我想使用自适应步长,那么定义它的最简单、最快的计算方法是什么?
我正在尝试在凸函数上使用梯度上升法,例如相对于其参数的多元正态密度函数(原始函数有点复杂),类似于最大似然估计。
我想知道如果我对步长使用恒定值,即 ,梯度上升方法是否会出现异常。
另外,如果我想使用自适应步长,那么定义它的最简单、最快的计算方法是什么?
将梯度上升与线搜索方法相结合来动态确定步长并不难。否则,对于固定步长 ,如果 \gamma 太小,您的算法可能需要太多步骤来最大化,或者如果,它可能找不到局部最大值。