正则化和拉格朗日乘数方法之间有什么联系?

机器算法验证 回归 优化 正则化
2022-01-29 04:57:14

为了防止过度拟合,人们在线性回归的成本函数中添加了一个正则化项(与模型参数的平方和成正比)和正则化参数这个参数和拉格朗日乘数一样吗?那么正则化和拉格朗日乘数的方法一样吗?或者这些方法是如何联系起来的? λλ

1个回答

假设我们正在优化具有参数的模型,通过最小化某些标准受到参数向量大小的约束(例如,通过以下方式实现结构风险最小化方法构建一组越来越复杂的嵌套模型),我们需要解决:θf(θ)

minθf(θ)s.t.θ2<C

这个问题的拉格朗日是(警告:我认为,这是漫长的一天...... ;-)

Λ(θ,λ)=f(θ)+λθ2λC.

因此很容易看出,正则化成本函数与约束优化问题密切相关,正则化参数与控制约束的常数 ( ) 有关,本质上是拉格朗日乘数。-项只是一个加法常数,因此如果省略它不会改变优化问题的解,只是目标函数的值。λCλC

这说明了为什么例如岭回归实现结构风险最小化:正则化相当于对权重向量的大小施加约束,如果则可以在遵守以下约束的情况下制作每个模型C1>C2

θ2<C2

也将在约束下可用

θ2<C1

因此,减少会生成一系列复杂度增加的假设空间。λ