与凸优化有关的困惑

计算科学 优化
2021-12-10 14:25:32

我一直在阅读有关凸优化的内容。我们有:

最小化f(x)英石 h(x)=0,g(x)0,xX

它的拉格朗日对偶是:

最大化ϕ(λ,μ)英石μ0, 在哪里ϕ(λ,μ)=inf[f(x)+λh(x)+μg(x)]

我不明白为什么必须大于零。谁能解释一下?μ

2个回答

对于这篇文章: L=L(λ,μ)=f(x)+λh(x)+μg(x)

你想要为所有有效的 有效的满足 ,L(λ,μ)f(x)x
xh(x)=0g(x)0

如果满足,则项为零,与无关。 xh(x)=0λh(x)Lλ

如果满足,则项为负或零,只要xg(x)0μg(x)Lμ0

对于有效是必需的这使得拉格朗日函数成为有效的下界L=f(x)+λh(x)+μg(x)f(x)xf(x)x

暂时忽略等式约束,只考虑不等式约束问题(假设所有函数至少一次连续可微)。现在想想点成为问题的最小化意味着什么:x

  • 如果它位于由描述的域的内部(即:),那么只能是一个最小化器,如果因为否则方向会降低函数值。因此,在这种情况下,最优条件时才满足g(x)0g(x)<0xf(x)=0ff(x)+μg(x)=0μ=0

  • 考虑最小值位于可行域边界的情况,即在这种情况下,成为最小化器,处的梯度必须垂直于边界并指向可行集,否则,将进入域或沿边界 a 的某个方向一点点会降低函数值。另一方面,向外方向垂直于边界的方向由给出。因此,我们可以将最优性条件表示为必须等于xg(x)=0xfxg(x)f(x)的负倍数换句话说,与一些乘数g(x)f(x)+μg(x)=0μ

说得通?如果您从几何学的角度来考虑,这实际上是一个非常直观的论点。