了解正交回归

数据挖掘 回归
2022-02-13 17:59:44

正交回归中,我们试图最小化与每个数据点的距离。(x,y)到拟合模型。

我的问题是,为什么正交回归中的自变量和因变量之间存在区别?

在我幼稚的理解中,我们试图实现的拟合并没有区分x,y- 我们想找到最小化距离总和的线(xi,yi).

1个回答

好问题。

简短的回答:自变量和因变量之间的区别可能对您的损失/误差函数无关紧要,但对您的建模函数可能很重要。

考虑用正交回归拟合抛物线。在这里,哪个变量依赖和独立非常重要,因为函数不是一对一的。所以我想说这种区别对于“建模”更重要。

在一个简单的情况下,例如拟合一条线,那么任何区别都可能更具哲学意义而不是实际意义。