我有以下损失函数
我在 tensorflow 中使用 SGD 对其进行优化。这ϕϕ是最小值的软近似值,因为最小值不可微,我使用了以下近似值:
其中 k 是负整数我也尝试了这里的公式,但模型很快收敛到局部最小值。
有没有其他方法来计算最小值?