时间序列的模型/变量选择

机器算法验证 时间序列 交叉验证 特征选择 模型选择 套索
2022-04-19 05:36:43

一般来说,是否有一种“最合适”的方法可以在时间序列上下文中执行模型选择以进行预测?

人们可以在文献中找到不同信息标准 (IC) 的丛林。仅举几例:AIC、AICc、AICu、MAIC、TIC、FPE、FPEu、Mallow's Cp、SIC、HQ、HQc、EIC ......在时间序列模型选择的背景下,这些标准(理论上或经验上,甚至只是定性)?

此外,据我了解,IC 可用于执行超参数调整/变量选择(例如,我可以使用 AIC 找到最好的pq对于 ARMA(p,q)模型,但我无法比较 ARIMA 的 AIC 值(1,1,1)与 ARIMA 一样(1,2,1)由于差异的顺序,我也无法将 ARMA 与 ETS 进行比较)。在执行模型选择而不是变量选择的方法上参考 IC 是否不正确?那么我是否只剩下滚动预测原点 CV(或其他修改后的 CV)来实际进行严格意义上的模型选择?

最后,如果是这样的话,IC 和 LASSO 方法似乎是直接竞争?最好的 IC 的性能与 LASSO 相比如何?更具体地说,“哪个”套索?事实上,我会假设它对我们选择正则化参数的方式有很大的影响λ: 选择不是-例如-多余的吗λ通过IC(比如AIC)?

将不胜感激任何先前问题或参考资料的答案。

1个回答

如果重点是时间序列和预测,那么我只会考虑滚动 CV。在使用时间序列时,排除任何创新(未知)过程是至关重要的。

IC 通过惩罚模型拟合(通过自由度或其他变量)来估计方差。这些公式是在计算能力和数据有限且分析解决方案更有效时设计的。