我对时间序列设置中的模型选择感兴趣。具体而言,假设我想从具有不同滞后阶数的 ARMA 模型池中选择一个 ARMA 模型。最终目的是预测。
型号选择可以通过
- 交叉验证,
- 使用信息标准(AIC、BIC),
在其他方法中。
Rob J. Hyndman 提供了一种对时间序列进行交叉验证的方法。对于相对较小的样本,交叉验证中使用的样本量可能与原始样本量有质的不同。例如,如果原始样本量是 200 个观测值,那么可以考虑通过获取前 101 个观测值并将窗口扩大到 102、103、...、200 个观测值来开始交叉验证,以获得 100 个交叉验证结果。显然,对于 200 次观察来说相当简约的模型对于 100 次观察来说可能太大了,因此它的验证误差会很大。因此,交叉验证可能会系统地支持过于简约的模型。由于样本大小不匹配,这是一种不良影响。
交叉验证的替代方法是使用信息标准进行模型选择。因为我关心预测,所以我会使用 AIC。尽管 AIC 渐近等效于最小化时间序列模型的样本外一步预测 MSE(根据Rob J. Hyndman 的这篇文章),但我怀疑这与样本无关,因为样本我关心的尺寸没有那么大...
问题:对于中小样本,我应该选择 AIC 时间序列交叉验证吗?