我想根据 MLE/梯度下降来理解正则化/收缩。我知道这两个概念,但我不知道/理解两者是否都用于确定线性模型的系数。如果是这样,遵循的步骤是什么?
为了进一步阐述,正则化用于减少方差,这是通过惩罚线性模型的系数来实现的。调整参数 lambda 是通过交叉验证确定的。一旦确定了 lambda,系数就会自动确定,对吧?因此,为什么我们需要最小化(RSS + 正则化项)来找到系数?是否有以下步骤:
- 通过交叉验证找到 lambda
- 通过 MLE 或 GD 最小化(RSS + 正则化)
- 查找系数
- 惩罚系数以减少方差
- 我们只剩下一小部分系数