衰退诊断

机器算法验证 回归 分布 数理统计
2022-04-05 01:42:35

为什么在回归设置中,自变量的数量必须少于数据点的数量?如果假设是相反的,即自变量的数量远远超过观察的数量,那么出路应该是什么?

1个回答

考虑一种最简单的可能情况。一个自变量(所以 2 个参数,包括常数)。一个数据点。

绘制一个数据点

通过该点画一条直线。通过同一点画一条不同的直线。画第三张。... 等等。

在此处输入图像描述

它们都完美地拟合了数据。你要选哪一个?

问题与两个点和两个预测变量相似(平面通过两个点,这有点像试图将一张胶合板放在尖桩篱笆上 - 在一个方向上稳定,但在另一个方向上是跷跷板) .