我读过这本很棒的书《统计学习的要素》 ,我对Lagrangian 形式 的 Lasso 问题的 lasso 方程有疑问:
我不知道为什么lasso 是必需的,但 ridge 则不需要。
参考
- Friedman, J.、Hastie, T. 和 Tibshirani, R. (2001)。统计学习的要素(第 1 卷,第 241-249 页)。纽约:Springer 统计系列。
我读过这本很棒的书《统计学习的要素》 ,我对Lagrangian 形式 的 Lasso 问题的 lasso 方程有疑问:
我不知道为什么lasso 是必需的,但 ridge 则不需要。
参考
没有什么“必要”的因素 . 为方便起见,它通常用于以下形式的二次目标使得矩阵最终成为目标函数的 Hessian 矩阵。
在这种情况下,作者在这两个问题之间并不一致。的因素 可以吸收(调整到)并导致一个等效的问题,即具有相同的 argmin(尽管不是相同的最佳目标值)。
因素显然没有实际意义,只是重新调整。要看到这一点,只需将目标函数乘以,那么 lasso 显然也解决了等价问题
因素只是为了方便而引入,即在套索的理论分析中简化写作。例如,KKT 条件会被很好地“缩放”,否则你会携带这个因素在整个分析过程中,从二次和的导数中得出。