进行时间序列预测时的良好做法

机器算法验证 时间序列 预测 有马
2022-03-27 00:00:37

几个月来,我一直致力于短期负荷预测和使用气候/天气数据来提高准确性。我有计算机科学背景,因此我试图在使用 ARIMA 模型等统计工具时不犯大错误和不公平的比较。我想知道你对几件事的看法:

  1. 我正在使用 (S)ARIMA 和 (S)ARIMAX 模型来研究天气数据对预测的影响,您认为是否有必要使用指数平滑方法?

  2. 有一个包含 300 个每日样本的时间序列,我从前两周开始,使用使用 auto.arima R 函数(预测包)构建的模型执行 5 天前的预测。然后,我将另一个样本添加到我的数据集中,并再次校准模型并执行另外 5 天的预测,依此类推,直到可用数据结束。你觉得这种操作方式正确吗?

感谢您的建议,虽然我们的工作目标是一篇工程期刊文章,但我想从统计学的角度做一个尽可能严谨的工作。

1个回答
  1. 我认为探索指数平滑模型也是值得的。指数平滑模型是与 ARIMA 模型完全不同的一类模型,可能会对您的数据产生不同的结果。

  2. 这听起来像是一种有效的方法,并且与Rob Hyndman提出的时间序列交叉验证方法非常相似

我将汇总每个预测的交叉验证误差(指数平滑、ARIMA、ARMAX),然后使用整体误差来比较这 3 种方法。

您可能还需要考虑对 ARIMA 参数进行“网格搜索”,而不是使用 auto.arima。在网格搜索中,您将探索 arima 模型的每个可能参数,然后使用预测精度选择“最佳”参数。