为什么在回归设置中,自变量的数量必须少于数据点的数量?如果假设是相反的,即自变量的数量远远超过观察的数量,那么出路应该是什么?
衰退诊断
机器算法验证
回归
分布
数理统计
2022-04-05 01:42:35
1个回答
考虑一种最简单的可能情况。一个自变量(所以 2 个参数,包括常数)。一个数据点。
绘制一个数据点
通过该点画一条直线。通过同一点画一条不同的直线。画第三张。... 等等。

它们都完美地拟合了数据。你要选哪一个?
问题与两个点和两个预测变量相似(平面通过两个点,这有点像试图将一张胶合板放在尖桩篱笆上 - 在一个方向上稳定,但在另一个方向上是跷跷板) .
其它你可能感兴趣的问题