ARIMA 模型是否有特征选择过程?

数据挖掘 时间序列 预测建模 特征选择
2022-02-24 11:10:13

我有一个代表某些产品每天销售额的数据集。它包含 30000 个观测值和 6 个特征(包括目标)。由于我的任务是预测售出的件数,因此我决定使用 ARIMA 模型(在此处遵循本教程)。

我意识到自动 ARIMA 的唯一预处理步骤是删除除目标之外的所有列。(因为自动 ARIMA 训练以前的值)。

所以,我的问题是:不执行任何特征选择而只将目标变量保留在 ARIMA 中是否很常见?

谢谢你。

1个回答

从某种意义上说,在拟合 ARIMA 模型之前进行特征选择是很常见的,或者至少是自然的(在我看来)。

问题在于,可以使用外生变量(如 ARIMA)的统计时间序列模型的自动特征选择技术似乎几乎没有发展。因此,我们如何进行特征选择尚不清楚。更糟糕的是,auto.arima 不对外生变量进行任何特征选择,它只是使用 AICc 来找到模型的最佳顺序(在其默认设置中以逐步方式)。如果您在模型中包含外生变量,它们将始终包含在选择过程中的所有模型中。

基本上,进行变量选择的一种方法是尝试所有可能的外生变量组合,使用 auto.arima 找到基于 AICc 的“最佳”顺序,记录该模型的 AICc(回想一下,AICc 会惩罚具有大量拟合的模型不会以合理的量增加模型可能性的参数),然后从所有外生变量组合中选择绝对最佳模型。有点痛苦,而且可能非常耗时。

我希望这有帮助。