Tibshirani 的 Lasso 估计器的偏差

机器算法验证 套索
2022-04-14 09:46:07

我正在寻找一个定理,它为来自 Tibshirani [1] 的 Lasso 估计器的偏差提供上限。有人知道这样的定理吗?

[1] 蒂布希拉尼,R.,(1996 年)。
“通过套索进行回归收缩和选择”,
皇家统计学会杂志。B 系列(方法)58:(1), p 267-88。

1个回答

假设我们有一个秩不足的最小二乘问题

minXβy2

其中的零空间中的非零向量。也就是说, αXXα=0

lasso 估计器可以表述为受约束的最小二乘问题,也可以表述为具有包括最小二乘项和一范数正则化的目标的无约束问题。我将使用受约束的公式:

minXβy22

受制于

β1t

其中是一个固定的正则化参数。为通过解决此约束优化问题获得的 Lasso 估计量。是最小二乘问题的最小 2 范数解,并假设tβLβ2β21t

现在考虑如果我们试图估计β

β=β2+sα ,

其中是一个非常大的标量。由于项对最小二乘目标没有影响,但大大增加了,我们可以有一个真正的一样好的最小二乘目标值ssαβ1ββ2

如果您使用贝叶斯方法,您可以通过指定有效排除此类解决方案的先验来避免此问题。