给定一组数据和训练点,假设我们得到如下形式的多项式回归
关于多项式的哪个阶更容易过拟合,是否有经验法则?例如,我们可以说随着多项式阶数的增加,过度拟合的可能性会增加吗?
此外,观察高阶多项式的爆炸行为是否常见?例如,您的数据集中在范围之间 . 多项式回归是否会爆炸到说的范围由于高阶项,权重,可能还有训练数据中的异常值?
给定一组数据和训练点,假设我们得到如下形式的多项式回归
关于多项式的哪个阶更容易过拟合,是否有经验法则?例如,我们可以说随着多项式阶数的增加,过度拟合的可能性会增加吗?
此外,观察高阶多项式的爆炸行为是否常见?例如,您的数据集中在范围之间 . 多项式回归是否会爆炸到说的范围由于高阶项,权重,可能还有训练数据中的异常值?
对于您的数据集不可知的特定阶多项式没有这样的规则。如果存在任何这样的规则,我希望它是您的数据或您的数据生成过程的函数——在不了解的情况下,很难说。不用说任何关于特定阶多项式的内容,您的一般陈述是正确的 - 更大的阶多项式更有可能过度拟合。随着多项式阶数的增加,估计量的方差也会增加。
是的,这是高阶多项式的常见问题。它与龙格现象在精神上相似。常见的解决方案是通过交叉验证(网格搜索)或通过正则化控制系数的大小来找到最佳顺序。