机器算法验证 - LARS 的套索修改 - 吾爱随笔录

LARS 的套索修改

机器算法验证套索

2022-03-20 10:33:08

我试图了解如何修改 Lars 算法以生成 Lasso。虽然我确实了解 LARS，但我无法从 Tibshirani 等人的论文中看到 Lasso 修改。特别是我不明白为什么非零坐标的符号必须与当前相关性的符号一致的符号条件。有人可以帮我解决这个问题。我想我正在寻找对原始 L-1 范数问题（即 Lasso）使用 KKT 条件的数学证明。非常感谢！

2个回答

让 $X$ （尺寸 $n\times p$ ) 表示一组标准化输入， $y$ （尺寸 $n \times 1$ ) 集中响应， $\beta$ （尺寸 $p \times 1$ ) 回归权重和 $\lambda > 0$ 一种 $l_1$ -范数惩罚系数。

LASSO 问题然后写

\begin{aligned} β^{*} & = {argmin}_{β} L (β, λ) \\ L (β, λ) & = ‖ y - X β ‖_{2}^{2} + λ ‖ β ‖_{1} \end{aligned}

$\begin{align} \beta^* &= \text{argmin}_{\beta}\ L(\beta,\lambda) \\ L(\beta,\lambda) &= \Vert y-X\beta \Vert_2^2 + \lambda \Vert \beta \Vert_1 \end{align}$

的所有值求解此问题产生所谓的 LASSO 正则化路径。 $\lambda > 0$ $\beta^*(\lambda)$

对于惩罚系数的固定值（即活动预测变量的固定数量 = LARS 算法的固定步长），可以证明满足（只需写出 KKT 平稳性条件，如下所示回答） $\lambda^*$ $\beta^*$

λ^{*} = 2 sign (β_{a}^{*}) X_{a}^{T} (y - X β^{*}), \forall a \in A

$\lambda^* = 2 \ \text{sign}(\beta_a^*) X_a^T (y - X \beta^*),\ \ \ \forall a \in A$

用表示一组活跃的预测器。 $A$

因为必须是正的（它是一个惩罚系数），很明显（任何非零的权重，因此是主动预测器）的符号应该与即与当前回归残差的相关性。 $\lambda^*$ $\beta_a^*$ $X_a^T (y - X\beta^*) = X_{a}^T r$

@Mr._White 对 LARS 和 Lasso 之间的主要区别提供了非常直观的解释；我要补充的唯一一点是，套索（有点）像一种向后选择方法，只要存在一个术语，就可以在每个步骤中剔除一个术语，因为这些（“标准化”超过）相关性存在。LARS 将所有内容都保存在那里——基本上以所有可能的顺序执行套索。这确实意味着在 lasso 中，每次迭代都取决于哪些项已被删除。 $X \times X$

Effron 的实现说明了差异很大：源 pkg 中的 lars.R 用于 lars。矩阵和从第 180 行开始的更新步骤的项的删除。我可以想象由空间引起的一些奇怪情况，其中术语不平衡（和非常相关但与其他项不相关，与但与其他项不相关，等等）选择顺序可能会非常有偏差。 $X \times X$ $\zeta$ $\zeta_{min} < \zeta_{current}$ $A$ $x_1$ $x_2$ $x_2$ $x_3$

其它你可能感兴趣的问题

上一篇调整自适应顺序分析的 p 值（用于卡方检验）？下一篇从时间序列的自相关函数中读取什么？