我有一个时间序列的预测模型,我想计算它的样本外预测误差。目前我正在遵循的策略是在Rob Hyndman 的博客(靠近页面底部)上建议的策略,如下所示(假设时间序列的训练集)
- 将模型拟合到数据并让成为下一次观察的预测。
- 将预测误差计算为。
- 重复
- 计算均方误差为
我的问题是,由于我的训练集重叠,我有多少需要担心相关性。特别是,假设我不仅要预测下一个值,还要预测下一个值,这样我就有了预测和错误,我想构建一个预测错误的期限结构。
我仍然可以每次将训练集的窗口向前滚动 1 ,还是应该向前滚动?如果我预测的系列中存在显着的自相关,这些问题的答案将如何变化(可以想象这是一个长记忆过程,即自相关函数以幂律而不是指数方式衰减。)
我会很感激这里的解释,或者链接到我可以找到关于 MSE 周围的置信区间(或其他错误度量)的理论结果的地方。