哪个模型更好:一个过拟合还是一个欠拟合?

机器算法验证 模型 过拟合
2022-04-14 10:28:16

从实际的角度来看,有一个过度拟合数据的模型还是一个欠拟合数据的模型更好?

3个回答

比较下图中的两个模型。第一条(红色曲线)严重过拟合数据,而第二条(蓝线)欠拟合。你能说出哪个更好吗?我会说两者都很糟糕。

两种型号

如果您的模型过拟合,那么它完全适合您的数据,但可能无法进行样本外预测。如果它不适合,那么如果它不适合您的样本内数据,但它可以在外部数据上更好或更差。两种情况都很糟糕。实际的角度来看,您选择最适合您的目的的模型,或者用两个词说,这取决于从实际的角度来看,您不会考虑较差的模型。

一般来说,很难说是过拟合还是欠拟合更不受欢迎——这可能取决于你的应用程序。

但在实践中,最好从一个有足够能力过拟合训练数据的模型开始,因为有很多技术可以处理过拟合(例如,正则化、dropout、降维等)

在 ARIMA 模型中,由于模型错误指定包含无根据的差分算子和自取消 ma 算子导致预测不佳,通常会执行过度拟合。加入自抵消ARMA结构也有同样的效果。就因果变量纳入统计上不显着(不必要,即与 0.0 不同)的滞后结构而言,通常影响很小或没有影响。我建议过度建模 ARIMA 模型可能是一个坏主意,而对休闲模型建模不足是一个坏主意。