数据挖掘 - 如何确定随机梯度下降的收敛性？ - 吾爱随笔录

在对批量梯度下降进行编码时，很容易对收敛进行编码，因为在每次迭代后成本趋于最小值，并且当成本的变化趋于接近预定义的数字时，我们停止迭代并得出梯度下降已经收敛的结论。但在随机 GD 中，成本往往会在某个时间点偏离局部 mimina。在这里确定变化的阈值不起作用，因为 SGD 并不总是趋于收敛，而是波动很大。在 python 中编码时，当成本趋于最低时，我如何知道迭代次数？