如何客观地(阅读“算法”)选择合适的模型来进行具有两个变量的简单线性最小二乘回归?
例如,假设数据似乎显示出二次趋势,并且生成了一条与数据非常吻合的抛物线。我们如何证明将其作为回归是合理的?或者我们如何消除存在更好模型的可能性?
我真正担心的是:我们可以继续添加多项式项,直到我们完全适合数据集(点的插值),没有任何错误。但就预测或推断而言,这将毫无用处,因为没有理由认为“模型”实际上是合适的。那么如何平衡准确性和直观吸引力的需求呢?
(另外,如果以前有人问过这个问题,请提醒我,我以为会这样,但没有找到任何东西。)