时间序列主题和矩阵配置文件算法是否适合我的问题?

机器算法验证 时间序列 相似之处 异常检测
2022-03-12 18:13:45

我有大量的多元时间序列要分析(TB 级数据),我需要快速、可扩展的算法来完成两个主要任务:

  • 在时间序列中找到相似的模式。例如,假设我在参考时间序列中识别出某种模式。我有一组不同的时间序列,我想知道在哪些时间序列中我可以找到相似的模式(比如说,相似的形状),以及时间序列的哪一部分。过去,我使用 Dynamic Time Warping 作为时间序列之间相似性的度量(更准确地说,作为度量),我非常喜欢它,因为它是一种非常直观的方法。但是,DTW 并不是我所说的“可扩展”算法(但我可能错了,在这种情况下请纠正我)。相反,有人告诉我应该切换到 SAX。

  • 多变量时间序列的异常检测。例如,我从一台处于“正常运行”状态的机器获取多个传感器测量值。然后我为同一台机器获取更多数据。我需要确定机器的行为何时与我认为的“正常操作”有很大不同。

看看 Mueen 和 Keogh 关于Matrix Profile的教程,我认为它可能对我的目标有所帮助(或者至少时间序列主题可能会有所帮助)。但是,我不熟悉这种用于时间序列分析的算法(我一般不是时间序列专家)。因此,在开始一项耗时的文献研究之前,我想知道:

  • 我对吗?这些工具对我的目标有用吗,还是有更好的方法?
  • 你能给我关于这些工具的直觉吗?当然,我不希望您向我展示详细的实现,而是可以帮助我更快地消化相关文献的东西。
1个回答

是的,Matrix Profile 允许发现不和谐,这对于异常检测非常有竞争力(根据多个独立测试)

是的,虽然“发现时间序列之间的相似性”有点模糊而无法明确回应,但 Matrix Profile 确实做到了。

如果您给教程的作者(我)写信,附上一些数据样本,他会提供更多建议。