谁能指出我改变的方法在噪声数值优化的梯度估计中?有些程序让用户给出一个固定的,它用于前向差分或中心差分梯度估计整个时间,从初始的大致线性斜率到最小值附近的大致二次谷。当然有一些自适应方法可以击败固定?
我正在寻找一种在实践中使用的简单方法,而不是理论。
4 月 23 日添加:有几个因素让这变得有趣:
噪声,粗糙度,是困难的。想象一下在崎岖的乡村徒步旅行,想要爬得更高,但只使用当地的坡度。有障碍物——噪音——在毫米、米、公里的范围内;有什么好测量粗糙度,不是为了它自己,而是为了爬得更高?
假设对 f(x) 的每次评估花费1美元,因此 10d 中的梯度估计花费10美元或(居中) 20美元。如果您只有100美元可花费,您如何权衡准确性来换取金钱?例如,在 10 个点的 10 个准确梯度上,一个人可以在 x 处花费 10美元,而不是 100美元, 然后只更新 x$ 1 \dots处的最大梯度分量{10}$,然后又是 10美元……可能性太多了。