计算科学 - 非线性最小二乘问题中优化函数的缩放 - 吾爱随笔录 - 问答

非线性最小二乘问题中优化函数的缩放

计算科学优化非线性规划

2021-12-23 03:25:10

假设我正在最小化以下功能：

g (α) = \sum_{i = 1}^{n} (y_{i} - f (x_{i}, α))^{2},

$g(\alpha)=\sum_{i=1}^n(y_i-f(x_i,\alpha))^2,$

在哪里 $y_i$ 和 $x_i$ 是数据， $f$ 是一个已知的非线性函数并且 $\alpha$ 感兴趣的参数（尺寸大于 1）。最小化是否更好

\frac{g (α)}{n}

$\frac{g(\alpha)}{n}$

而是为了防止舍入错误等？在我的情况下，我得到了相互矛盾的结果，对于某些问题，归一化会导致实现收敛的比例大幅提高（我进行 MC 模拟，所以我知道真实值 $\alpha$ ) 在其他情况下不是那么多。也许有某种算法或一般建议何时选择缩放，何时不选择？

我使用 R 的optim函数进行优化。我试过了method=Nelder-Mead，"CG"和"BFGS"。结果不同CG和BFGS相同Nelder-Mead。差异很小，但可以衡量，尤其是对于BFGS. 自然地，我为每次优化运行使用相同的起始值和相同的数据。

2个回答

优化的难点在于找到最小值的位置，而不是此时的值。这就是为什么您的缩放没有区别：位置完全相同。此外，无论您是否缩放目标函数，每个合理的优化算法都应该产生完全相同的中间点序列（迭代）。例如，对于牛顿法，这很容易看出。

当然，如果您使用的是自己的最小化器，并且它不具备无论函数是否缩放，迭代序列都相同的特性，那么您就有麻烦了。然而，这主要只是表明算法设计存在问题。

如果 Nelder-Mead 是一致的，但基于梯度的方法不是，则可能是梯度缩放不当。例如。参数 n 的单位变化对目标函数的影响与参数 m 的单位变化非常不同。尝试将参数（什么是 f btw？）缩放到（大约）相同的范围，或者如果你可以更好，这样如果你将任何单个参数更改给定数量，目标函数也会发生类似的变化。（例如http://www.alglib.net/optimization/scaling.php）

其它你可能感兴趣的问题

上一篇在欧拉网格上映射 SPH 数据以进行进一步演化下一篇对一阶 ODE 系统进行数值积分的代码