我最近使用 ARIMA 模型并意识到它们在经济学和其他科学领域中的普遍性。你可以在网上找到几十篇使用 ARIMA 模型的文章,但你能找到的关于 ARIMA 模型缺点的文章相对较少。
ARIMA 模型在方法论和统计上的主要弱点是什么?有没有人有很好的科学文章来处理这个话题?
我最近使用 ARIMA 模型并意识到它们在经济学和其他科学领域中的普遍性。你可以在网上找到几十篇使用 ARIMA 模型的文章,但你能找到的关于 ARIMA 模型缺点的文章相对较少。
ARIMA 模型在方法论和统计上的主要弱点是什么?有没有人有很好的科学文章来处理这个话题?
一个关键的缺点是 ARIMA 模型往往不能很好地预测。(我敢肯定,我会为该声明得到我的反对意见。是的,从某种意义上说它太宽泛了,但我相信它是一个有用的一阶近似值。)
这在早期的预测竞赛中令人惊讶,至少对于已经完成(或最初编写)关于 ARIMA 模型的最优性和类似属性的所有证明的统计学家来说 - 尽管只是假设真实的数据生成过程实际上确实遵循 ARIMA 过程,并且通常也使用渐近结果。
在我对为什么非独立同分布噪声对传统时间序列方法如此重要的回答中获得更多信息?,其中我还链接到了Rob Hyndman 的“预测竞赛简史”(2020,IJF),这是非常有启发性的阅读。
在我的回答中,我恭敬地不同意接受的答案。
首先,ARIMA 模型不能很好地预测比赛这一事实并不是 ARIMA 的弱点,而是证明产生所讨论时间序列的随机过程不是 ARIMA 和 ARIMA 不应该用于第一名。例如,具有非线性相关性的时间序列显然不能被 ARIMA 很好地预测,但这并不是 ARIMA 的缺点。如果您从 ARIMA 过程模拟时间序列,那么 ARIMA 模型将在预测方面做得非常出色。如果使用错误的工具导致性能不佳 - 这并不能证明该工具存在缺陷。
其次,如果 ARIMA 模型因其在预测方面的表现而受到指责,那么在我看来,可以充分证明它们仅在长期预测方面表现不佳。他们也可能因为假设误差项是具有恒定方差的白噪声而出错,这会转化为恒定的预测误差。但是 GARCH 系列模型可以帮助适应随时间变化的自相关方差。
另一点与这样一个事实有关,即抛弃旧方法以支持新近出现的新方法是一种趋势。在预测比赛中,我们似乎应该放弃 ARIMA 来使用机器学习方法。但
如果正如 whuber 所指出的那样,可以证明现实世界中几乎没有任何由 ARIMA 过程驱动的现象,那么可以证明 ARIMA 的适用性有限。对我来说,预测比赛的最大发现是,各种方法的组合平均而言(在比赛中)始终优于任何特定方法。这似乎支持这样的说法,即实时序列来自比我们的模型库(包括 ARIMA 和机器学习模型)中的过程复杂得多的过程。然而,这是对任何单个模型类型的控诉——无论是 ARIMA 模型还是机器学习模型。但不知何故,结论被错误地转化为机器学习——很好;ARIMA - 不好。