为什么我们将线性回归中的最小二乘估计方程称为*正规方程*?

机器算法验证 回归 最小二乘 术语 线性的
2022-02-15 05:04:00

当我们要估计线性回归的参数时,我们使正规方程与线性模型包含的未知数一样多。为什么这些方程称为正规方程?

1个回答

我将给出可能是最常见的理解,然后是一些额外的细节。

法线是几何学中的一个术语(维基百科):

在几何学中,法线是一个对象,例如垂直于给定对象的线或向量。

这又似乎来自木匠或泥瓦匠的广场 [1]

正常和正常。根据牛津英语词典,在拉丁语中,norma 可能意味着木匠、泥瓦匠等用来获得直角、直角或实践或行为标准或模式的正方形。这些含义反映在基于规范和正常的数学术语中。

并且从几何学中,该术语移动到向量空间中。

这里给出了“正规方程”的直接答案:http: //mathworld.wolfram.com/NormalEquation.html

之所以称为正规方程,是因为bAx是正常的范围A.

(在通常的回归符号中,即 'yXb是正常的范围X')

从字面上看,最小二乘残差垂直于(成直角)跨越的空间X.

绘制最小二乘几何

y-向量位于n方面。X 矩阵跨度p那些(或p+1取决于您的符号是如何设置的;如果X是满秩的,它是 X 的列数)。最小二乘解Xβ^是该空间中最近的点X到那个y-vector(实际上,字面上的投影y到跨越的空间X)。必然的情况是,通过最小化平方和,差yXβ^与跨越的空间正交X. (如果不是,将会有一个更小的解决方案。)

然而,正如 whuber 在评论中所暗示的那样,它并不是那么明确。

再看[1]:

1822 年 Gauss [James A. Landau] 引入了最小二乘法中的 NORMAL EQUATION 一词。Kruskal & Stigler 的“规范术语”(在 Stigler (1999) 中)考虑了关于术语来自何处的各种假设,但没有发现任何非常令人满意的假设。

然而,正规方程的方法通常归功于 Legendre,1805。

[1] Miller, J. (ed) "Earliest known uses of some of maths, N" in Earliest known uses of some of the words of math