机器算法验证 - 如何解释套索选择图 - 吾爱随笔录

如何解释套索选择图

机器算法验证 r 数据可视化解释套索

2022-03-28 14:33:21

我做了套索选择lars::lars()，然后我得到了这个情节。我不知道如何解释它：在此处输入图像描述

谁能提供一个简短的解释？它为什么要standardized coefficients谋反|beta|/max|beta|？

1个回答

在回归中，您希望找到最小化的： $\beta$
$(Y - X_1\beta_1 - X_2\beta_2 - \text{...})^2$

LASSO 将惩罚项应用于最小化问题：
$(Y - X_1\beta_1 - X_2\beta_2 - \text{...})^2 + \alpha\sum_i{|\beta_i|}$

因此，当为零时，没有惩罚，并且您有 OLS 解决方案 - 这是最大值（或者因为我没有把它写成向量，所以 max）。随着惩罚的增加，被拉向零，不太重要的参数被更早地拉向零。在某个级别的中，所有的都被拉为零。 $\alpha$ $|\beta|$ $\sum{|\beta_i|}$
$\alpha$ $\sum{|\beta_i|}$ $\alpha$ $\beta_i$

这是图表上的 x 轴。当向右移动时，它不是将其表示为左侧的高垂直条表示变量何时被拉为零（并且似乎标有剩余变量的数量） $\alpha$

对于作为标准化系数的 y 轴，通常在运行 LASSO 时，您可以标准化 X 变量，以便对变量进行同样的惩罚。如果它们是在不同的尺度上测量的，那么惩罚将是不均匀的（例如，考虑将一个解释变量的所有值乘以 0.01 - 那么 OLS 估计的系数将是大小的 100 倍，并且在运行 LASSO 时会更难拉）。

其它你可能感兴趣的问题

上一篇用于分类的 MLP 与用于回归的 MLP 如何以及为什么会有所不同？不同的反向传播和传递函数？下一篇集成技术会增加 VC 维度吗？