我有大量的多元时间序列要分析(TB 级数据),我需要快速、可扩展的算法来完成两个主要任务:
在时间序列中找到相似的模式。例如,假设我在参考时间序列中识别出某种模式。我有一组不同的时间序列,我想知道在哪些时间序列中我可以找到相似的模式(比如说,相似的形状),以及时间序列的哪一部分。过去,我使用 Dynamic Time Warping 作为时间序列之间相似性的度量(更准确地说,作为度量),我非常喜欢它,因为它是一种非常直观的方法。但是,DTW 并不是我所说的“可扩展”算法(但我可能错了,在这种情况下请纠正我)。相反,有人告诉我应该切换到 SAX。
多变量时间序列的异常检测。例如,我从一台处于“正常运行”状态的机器获取多个传感器测量值。然后我为同一台机器获取更多数据。我需要确定机器的行为何时与我认为的“正常操作”有很大不同。
看看 Mueen 和 Keogh 关于Matrix Profile的教程,我认为它可能对我的目标有所帮助(或者至少时间序列主题可能会有所帮助)。但是,我不熟悉这种用于时间序列分析的算法(我一般不是时间序列专家)。因此,在开始一项耗时的文献研究之前,我想知道:
- 我对吗?这些工具对我的目标有用吗,还是有更好的方法?
- 你能给我关于这些工具的直觉吗?当然,我不希望您向我展示详细的实现,而是可以帮助我更快地消化相关文献的东西。