我正在处理的问题是预测时间序列值。我一次查看一个时间序列,基于例如 15% 的输入数据,我想预测它的未来值。到目前为止,我遇到了两个模型:
- LSTM(长期短期记忆;一类循环神经网络)
- 有马
我都尝试过并阅读了一些关于它们的文章。现在我试图更好地了解如何比较两者。到目前为止我发现了什么:
- 如果我们处理大量数据并且有足够的训练数据可用,LSTM 效果会更好,而 ARIMA 更适合较小的数据集(这是正确的吗?)
- ARIMA 需要一系列参数
(p,q,d)
,必须根据数据计算得出,而 LSTM 不需要设置这些参数。但是,我们需要为 LSTM 调整一些超参数。 - 编辑:我在这里阅读一篇很棒的文章时注意到两者之间的一个主要区别是,ARIMA 只能在固定时间序列(没有季节性、趋势等)上表现良好,如果你需要注意这一点想用 ARIMA
除了上述属性,我找不到任何其他点或事实可以帮助我选择最佳模型。如果有人能帮我找到文章、论文或其他东西,我将不胜感激(到目前为止没有运气,只有一些一般性的意见,没有任何基于实验的意见。)
我不得不提一下,最初我正在处理流数据,但是现在我使用的是NAB 数据集,其中包括 50 个数据集,最大大小为 20k 数据点。