梯度下降可以应用于非凸函数吗?
机器算法验证
优化
2022-02-09 11:48:13
2个回答
您绘制的函数确实不是凸的。但是,它是准凸的。
梯度下降是一种用于连续优化的通用方法,因此它可以并且非常普遍地应用于非凸函数。使用平滑函数和合理选择的步长,它将生成一系列点,其值严格递减。
不管凸性如何,梯度下降最终都会收敛到函数的一个固定点。如果函数是凸的,这将是一个全局最小值,但如果不是,它可能是一个局部最小值,甚至是一个鞍点。
拟凸函数是一个有趣的例子。拟凸函数的任何局部最小值也是全局最小值,但拟凸函数也可以有非局部最小值的驻点(以为例)。因此,理论上梯度下降可能会卡在这样的静止点上,而不是进展到全局最小值。在您的示例中,如果图表左侧的肩部要完美平整,则梯度下降可能会卡在那里。但是,诸如重球方法之类的变体可能能够“滚动”并达到全局最小值。