我计划使用准牛顿法 (L-BFGS) 来最小化非线性目标函数。
梯度有点有趣:随着第一组参数的值接近无穷大,目标函数相对于其余参数的梯度将接近零。换句话说,
重要的概念:这种关系与目标函数是否被最小化无关。我担心 L-BFGS 算法会遵循这样一条路径,即梯度被这种关系最小化,而不是被适当地最小化。
我可以利用这些知识来帮助我制定优化策略吗?
我计划使用准牛顿法 (L-BFGS) 来最小化非线性目标函数。
梯度有点有趣:随着第一组参数的值接近无穷大,目标函数相对于其余参数的梯度将接近零。换句话说,
重要的概念:这种关系与目标函数是否被最小化无关。我担心 L-BFGS 算法会遵循这样一条路径,即梯度被这种关系最小化,而不是被适当地最小化。
我可以利用这些知识来帮助我制定优化策略吗?