如何解释套索选择图

机器算法验证 r 数据可视化 解释 套索
2022-03-28 14:33:21

我做了套索选择lars::lars(),然后我得到了这个情节。我不知道如何解释它: 在此处输入图像描述

谁能提供一个简短的解释?它为什么要standardized coefficients谋反|beta|/max|beta|

1个回答

在回归中,您希望找到最小化的β
(YX1β1X2β2...)2

LASSO 将惩罚项应用于最小化问题:
(YX1β1X2β2...)2+αi|βi|

因此,当为零时,没有惩罚,并且您有 OLS 解决方案 - 这是最大值(或者因为我没有把它写成向量,所以 max)。 随着惩罚的增加,被拉向零,不太重要的参数被更早地拉向零。在某个级别的中,所有的都被拉为零。 α|β||βi|
α|βi|αβi

这是图表上的 x 轴。当向右移动时,它不是将其表示为左侧的高垂直条表示变量何时被拉为零(并且似乎标有剩余变量的数量)α

对于作为标准化系数的 y 轴,通常在运行 LASSO 时,您可以标准化 X 变量,以便对变量进行同样的惩罚。如果它们是在不同的尺度上测量的,那么惩罚将是不均匀的(例如,考虑将一个解释变量的所有值乘以 0.01 - 那么 OLS 估计的系数将是大小的 100 倍,并且在运行 LASSO 时会更难拉)。