我有一个连续变量,在一年的一段时间内不定期采样。有些日子每小时有一次以上的观察,而其他时期几天都没有。这使得检测时间序列中的模式变得特别困难,因为某些月份(例如 10 月)是高度采样的,而其他月份则不是。
我的问题是对这个时间序列建模的最佳方法是什么?
- 我相信大多数时间序列分析技术(如 ARMA)需要一个固定的频率。我可以汇总数据,以获得恒定样本或选择非常详细的数据子集。使用这两个选项,我会丢失原始数据集中的一些信息,这可能会揭示不同的模式。
- 我可以将整个数据集提供给模型,并期望它能够拾取模式,而不是循环分解系列。例如,我将小时、工作日和月份转换为分类变量,并尝试了多元回归,结果很好 (R2=0.71)
我的想法是,像 ANN 这样的机器学习技术也可以从不均匀的时间序列中挑选出这些模式,但我想知道是否有人尝试过,并且可以为我提供一些关于在神经网络中表示时间模式的最佳方式的建议。