在机器学习代码中,通过最大似然估计计算线性回归模型的最佳参数
其中是目标向量,是多项式特征矩阵。在链接的笔记本中,我们可以找到:
出于数值稳定性的原因,我们经常在\boldsymbol\Phi^T\boldsymbol\Phi中添加一个小的对角“抖动” ,这样我们就可以在没有明显问题的情况下反转矩阵,从而使最大似然估计变为\boldsymbol \theta^ \text{ML} = (\boldsymbol\Phi^T\boldsymbol\Phi + \kappa\boldsymbol I)^{-1}\boldsymbol\Phi^T\boldsymbol y
在代码中,是非常小的值 1e-08。
那么,对角线“抖动” 是如何影响稳定性的呢?