假设我正在最小化以下功能:
在哪里和是数据,是一个已知的非线性函数并且感兴趣的参数(尺寸大于 1)。最小化是否更好
而是为了防止舍入错误等?在我的情况下,我得到了相互矛盾的结果,对于某些问题,归一化会导致实现收敛的比例大幅提高(我进行 MC 模拟,所以我知道真实值) 在其他情况下不是那么多。也许有某种算法或一般建议何时选择缩放,何时不选择?
我使用 R 的optim函数进行优化。我试过了method=Nelder-Mead,"CG"和"BFGS"。结果不同CG和BFGS相同Nelder-Mead。差异很小,但可以衡量,尤其是对于BFGS. 自然地,我为每次优化运行使用相同的起始值和相同的数据。