具有不良条件预测变量的 LASSO

机器算法验证 最小二乘 套索
2022-03-21 10:05:07

我需要求解形式的方程,其中矩阵和Ax=bAm×nm>n

我正在查看通常的最小二乘解,其中是伪逆,而 LASSO 解x0=A+bA+xL

我观察到,当的最小奇异值变得非常小时,变得狂野,元素非常大。这当然一点也不意外。令人惊讶的是,仍然表现得非常好。Ax0xL

为什么 LASSO 解决方案对的病态条件几乎不敏感?A

编辑:我已经按照建议查阅了“统计学习要素”一书,但我无法在其中找到对我的问题的解释。我理解为什么当病态时 ridge 算法表现良好:这是因为 ridge 的解决方案不涉及 A 的逆,A的逆,所以这使解决方案正规化。我想在 LASSO 的情况下得到类似的理解。AAA+λ

1个回答

当您说您正在解决时,您会自动将自己置于正常的 OLS 回归问题中。Lasso根本不属于那种问题,这就是为什么“矩阵病态”没有什么意义。Ay=b

通过求解正常的 OLS,您会发现最小化b

RSS(b)=(yib0jxijbj)2.

您将其重写为:

RSS(b)=(yXb)T(yXb)

有解决方案

b=(XTX)1XTy=Ay

这是您提到的线性规划问题,其中矩阵是病态的。 当你切换到 lasso 时,问题就变成了:A

RSS(b)=(yXb)T(yXb)+λb

这最终会是:

b=(XTX)(2XTy+λ)

这根本不能写成形式,所以不可能看到原始矩阵如何影响问题。 Ay=bA

是病态 的这一事实对 LASSO 问题没有影响,因为它只是解决了一个不同的二次问题!(并且矩阵病态仅针对线性系统定义)(XTX)1XT