线性回归和不可逆性

机器算法验证 回归 逆矩阵 梯度下降
2022-03-15 17:44:47

在线性回归中,有两种方法可以最小化成本函数:第一种是使用梯度下降。第二个是将成本函数的导数设置为零并求解结果方程。求解方程时,最小化成本函数的参数值由以下众所周知的公式给出:

β=(XTX)1XTY

在哪里β是参数值,X是设计矩阵,并且Y是响应向量。

请注意,有一个解决方案XTX必须是可逆的。我认为即使XTX是不可逆的,我们仍然可以使用第一种方法(梯度下降)最小化成本函数。如果这是真的,那么困扰我的是梯度下降的哪个属性使它不容易受到这类问题的影响。

谢谢

3个回答

你真正想要解决的是

XTXβ=XTY.
这个方程有一个解,如果XTX是可逆的(非奇异的)。如果不是,你有更多的解决方案。然后你需要分析原因,即会有一些关于X这使得XTX单数。在数学术语中,列X线性相关的。在计量经济学术语中,存在多重共线性

我不确定你的特定问题,但我怀疑你用来最小化成本函数的方法对可逆性有任何影响XTX. 问题出在规范中。

存在用于分析哪些列是线性相关/多共线的方法,以哪种方式。它们可能有助于发现规范错误。在计量经济学中,这些问题通常通过展示合适的可估计函数或更改原始问题的规范来解决。您应该在文献中搜索其中一些概念,以找到适合您的问题和先验知识的内容。

我们可以得到解决方案

β=(XTX)1XTY
即使(XTX)1是单数。但是,解决方案不会是唯一的。我们可以绕过问题(XTX)1通过使用广义逆来解决问题是奇异的。

矩阵Xg是矩阵的广义逆A当且仅当它满足AXgA=A.

因此,使用广义逆的定义,我们可以将最小二乘方程的解写为

β=(XTX)gXTY

使用摩尔-彭罗斯逆!它通常是“最好的”广义逆,因为它最小化了残差平方和(如果你假设高斯噪声在Y)它是独一无二的这是你的梯度下降应该收敛的,但是因为损失是二次的,它也可以直接解决(例如使用 SVD)。

还要研究加权最小二乘法广义最小二乘法,以便立即推广到处理具有更复杂方差/相关性的数据。