使用 ARIMA 模型时,我们是否必须将数据集拆分为训练和测试?

数据挖掘 r 时间序列 训练 预测
2022-03-01 10:24:11

我正在做一个项目,我预测在 ITEM/DAY 级别销售的总数量。至于模型,我决定使用 ARIMA 模型(我正在使用 R)。为了获得指导,我决定遵循以下两个教程:

第一个在这里

第二个在这里

我感到困惑的是,在第二个中,他们将数据拆分为训练和测试,并将模型拟合到训练集并在测试集上进行评估(所有这些都是有道理的)。但是,在第一篇文章中,他们没有进行拆分。

谁能指导我正确的方法并为我提供解释?

谢谢你。

1个回答

是否拆分训练集和测试集取决于您的分析目的。您可以采用统计方法机器学习方法

在经典的统计方法中,您可以在整批数据上拟合模型。您的目标是检查变量参数的符号,以及它们是否显着。从科学上讲,这些参数中的每一个都代表了对假设的检验。

在机器学习方法中,您需要一个擅长预测从未见过的数据的模型。您不关心给定变量是否与您的因变量有正或负关联,您不关心您的参数是否 95% 显着,您只关心模型尽可能精确地预测输出。

所以,你的问题的答案是:这取决于!你需要你的模型做什么?