机器算法验证 - LASSO的图解解释 - 吾爱随笔录

LASSO的图解解释

机器算法验证机器学习套索正则化

2022-03-28 05:21:45

我对 LASSO 的图形直觉有疑问。我正在理解为什么套索在与钻石的一角相交的情况下会产生零系数。但是我不明白套索回归只是缩小参数而不将它们设置为零的情况。因此，如果 RSS 线与菱形的“边”相交。假设在图中的情况下， $\beta_1$ 更大和 $\beta_2$ 更小。因此，RSS 线可能会与一侧相交。

当 RSS 线与菱形的一侧而不是角相切时，你能给我一些直觉吗？

2个回答

回想一下，Lasso 最小化问题可以表示为：

{\hat{θ}}_{l a s s o} = a r g m i n_{θ \in R^{n}} \sum_{i = 1}^{m} (y_{i} - {x_{i}}^{T} θ)^{2} + λ \sum_{j = 1}^{n} | θ_{j} |

$\hat \theta_{lasso} = argmin_{\theta \in \mathbb{R}^n} \sum_{i=1}^m (y_i - \mathbf{x_i}^T \theta)^2 + \lambda \sum_{j=1}^n | \theta_j| \$

这可以看作是两个术语的最小化： $OLS + L_1$ .

第一个 OLS 项可以写为 $(y - X \theta)^T(y - X \theta)$ 这产生了一个以最大似然估计器为中心的椭圆等高线图。
第二 $L_1$ 项是以 0 为中心的钻石的方程（或更高维度的 romboid）
约束优化的解决方案在于两个函数的轮廓之间的交点，并且该交点随 $\lambda$ . 为了 $\lambda = 0$ 解决方案是 MLE（像往常一样）和 $\lambda = \infty$ 解决方案在 $[0,0]$ .
由于在菱形的顶点处，一个或多个变量的值为 0，因此一个或多个系数的值恰好等于 0 的概率不为零。

最后一个项目符号对于回答您的问题很重要：

但是我不明白套索回归只是缩小参数并且不将它们设置为零的情况

套索回归不必将系数设置为零，在许多情况下不需要。会发生什么，当你增加 $\lambda$ 参数，解决方案发生在菱形顶点的概率增加，因此一个或多个系数恰好为零的概率也增加。

当 RSS 线与菱形的一侧而不是角相切时，你能给我一些直觉吗？

这是我根据模拟数据制作的图表。它显示了岭回归和套索回归的最佳解决方案，作为 $\lambda$ 参数（套索在右手边）。

可以看到有很多解不在菱形的顶点上！

强相关特征的影响

这个简单的例子展示了当两个特征高度相关时会发生什么，实际上在这里 $x_1 = x$ 和 $x_2 = x^2$ 所以它们之间的相关性如此之强，以至于 OLS 成本函数的形状看起来像一个倒置的山脊或山谷——这就是山脊回归背后的直觉。

来源

这篇文章强烈基于我之前的文章- 对于任何感兴趣的人，您可以在我的博客和此页面上找到大部分代码和相关的数学推导

我猜钻石的作用很清楚：简而言之，（这张图片中的两个）系数所在的区域使得它们的绝对值之和不超过“预算” $s$ .

椭圆表示残差平方和取相同值的区域。OLS 估计 $\hat\beta$ 顾名思义，就是那个总和最小的点。因此，我们离该点越远，总和就越大。

我们现在寻找一个点，它触及满足预算约束的区域，同时使残差平方和不大于必要的值。

其它你可能感兴趣的问题

上一篇一个快速的统一顺序统计生成器下一篇假设检验：单边检验的零假设