多项式回归和其他问题中的过度拟合

机器算法验证 回归 配件 过拟合
2022-03-26 01:57:16

给定一组数据和训练点,假设我们得到如下形式的多项式回归

f(x)=w0+w1x+wnxn

  • 关于多项式的哪个阶更容易过拟合,是否有经验法则?例如,我们可以说随着多项式阶数的增加,过度拟合的可能性会增加吗?

  • 此外,观察高阶多项式的爆炸行为是否常见?例如,您的数据集中在范围之间 [5,+5]. 多项式回归是否会爆炸到说的范围[1000,1000]由于高阶项xn,权重,可能还有训练数据中的异常值?

1个回答
  • 对于您的数据集不可知的特定阶多项式没有这样的规则。如果存在任何这样的规则,我希望它是您的数据或您的数据生成过程的函数——在不了解的情况下,很难说。不用说任何关于特定阶多项式的内容,您的一般陈述是正确的 - 更大的阶多项式更有可能过度拟合。随着多项式阶数的增加,估计量的方差也会增加。

  • 是的,这是高阶多项式的常见问题。它与龙格现象在精神上相似常见的解决方案是通过交叉验证(网格搜索)或通过正则化控制系数的大小来找到最佳顺序。