Elastic Net 公式之间的等效性

机器算法验证 回归 优化 套索 岭回归 弹性网
2022-03-31 06:15:27

根据 Hastie 的论文,弹性网有两个等效的公式:

β^=argminβ{i=1N(yij=1pxijβj)2+λ1j=1p|βj|+λ2j=1pβj2}

β^=argminβ{i=1N(yij=1pxijβj)2} s.t. (1α)j=1p|βj|+αj=1pβj2t

在哪里α=λ2λ1+λ2

我的问题是如何正式证明这种等价性。岭回归和套索也有这两种可能的公式,但我找不到任何证明这种等价性的参考。我在 CrossValidated 中发现的一个类似问题是这个

岭回归背景下的拉格朗日松弛

但我无法理解特里斯坦的解释。我对拉格朗日优化理论有一些了解,我想答案就在这些方面,但是由于所有论文都将等价性视为显而易见的,我想找到一个明确证明这一点的适当参考。

1个回答

从...开始

β^=argminβXβy22 s.t. (1α)β1+αβ22t,
我们可以将这个优化问题的对偶拉格拉格公式写为 我们看到这确实看起来像第一个问题你写的,带有参数,这导致“弹性”参数的表达式: 话虽如此,从这一点到邹和哈斯蒂断言这两个问题是等价的,我承认我错过了一两步……
L(β,α,λ)=Xβy22+λ((1α)β1+αβ22t)=Xβy22+λ(1α)β1+λαβ22λt,
λ1=λ(1α)λ2=λα
α=λ2λ1+λ2.