我做了套索选择lars::lars()
,然后我得到了这个情节。我不知道如何解释它:
谁能提供一个简短的解释?它为什么要standardized coefficients
谋反|beta|/max|beta|
?
我做了套索选择lars::lars()
,然后我得到了这个情节。我不知道如何解释它:
谁能提供一个简短的解释?它为什么要standardized coefficients
谋反|beta|/max|beta|
?
在回归中,您希望找到最小化的:
LASSO 将惩罚项应用于最小化问题:
因此,当为零时,没有惩罚,并且您有 OLS 解决方案 - 这是最大值(或者因为我没有把它写成向量,所以 max)。
随着惩罚的增加,被拉向零,不太重要的参数被更早地拉向零。在某个级别的中,所有的都被拉为零。
这是图表上的 x 轴。当向右移动时,它不是将其表示为左侧的高垂直条表示变量何时被拉为零(并且似乎标有剩余变量的数量)
对于作为标准化系数的 y 轴,通常在运行 LASSO 时,您可以标准化 X 变量,以便对变量进行同样的惩罚。如果它们是在不同的尺度上测量的,那么惩罚将是不均匀的(例如,考虑将一个解释变量的所有值乘以 0.01 - 那么 OLS 估计的系数将是大小的 100 倍,并且在运行 LASSO 时会更难拉)。