文献中提供了许多正则化措施,这对初学者来说有点困惑。经典的惩罚是Hoerl & Kennard (1970, Technometrics 12, 55-67) 的 ridge。
Tibshirani (1996, Journal of the Royal Statistical Society B 58, 267–288)对此的另一个修改是lasso ,定义为:
另一种惩罚是弹性净惩罚(Zou and Hastie 2005, Journal of the Royal Statistical Society B 67, 301-320),它是 lasso 惩罚和 ridge 惩罚的线性组合。因此,处罚涵盖了这两种极端情况。
我能找到的另一个惩罚是 Frank & Friedman (1993, Technometrics 35, 109–148) 中引入的桥牌惩罚。其中 λ̃ = (λ, γ)。它具有一个额外的调整参数γ,它控制估计系数向量的偏好程度,以与回归空间中的原始数据轴方向对齐,因此是标准化的数据轴方向。它包括作为特殊情况的套索惩罚(γ = 1)和岭惩罚(γ = 2)。
我的问题是:对于使用的惩罚类型是否有任何偏好 - 来自或来自统计教科书?或者这只是反复试验?请用外行语言解释。