经过几天的研究,我可以对现有的对时间序列进行异常检测的方法进行全局了解,即:
使用深度学习进行预测。例如。RADM或 LSTM 模型
用自动编码器去噪固定长度的窗口(深度学习方法)。例如。MAD-GAN、CNN/LSTM 自编码器、变分自编码器等。
没有深度学习的去噪。例如。应用 Kalman 或 Hodrick Prescott 等过滤器,并测试预测与原始时间序列的偏差是否低于阈值。
也许还有更多方法无法归类到此屏幕截图中。
我的问题是,根据可能出现的数据集类型,哪种方法更适合开发时间序列异常系统的需要,该系统:
- 以单变量方式检测异常,但允许多元后验积分。
- 适用于在线数据流和运行时适应/学习
- 能够学习具有多个季节性的数据分布。
- [Plus] 可能允许在任何步骤进行半监督改进。
注意:考虑可能具有不同趋势的时间序列;无,一个或多个季节性;定性/步进/连续时间序列;或多或少缺少数据等。