基于窗口的排序是为 LSTM 获取更多训练数据的好主意吗?

数据挖掘 lstm 数据 自动编码器 异常检测
2022-02-14 07:16:38

我正在尝试使用 LSTM 对时间序列进行基于无监督自动编码器的异常值检测。在这里,有多个时间序列,整个序列都被视为异常值。但是,我只有大约 25-30 个时间序列实例可以处理(尽管每个序列包含约 10k 点)。
我想知道为每个时间序列创建滑动窗口以生成更多数据是否是更准确地训练自动编码器的好主意。此外,在这种情况下,如何合并结果以选择性地识别原始 25-30 时间序列中的哪一个是异常值?
我在使用 LSTM 方面相对较新,非常感谢关于这个想法是否可行的建议。

1个回答

将时间序列拆分为分析窗口(通常具有重叠)是很常见的做法。在异常检测中,也在分类或预测中。只要可以通过独立分析此类窗口来检测您的异常情况,它就可以很好地工作。

在这样的设置中,分析窗口的长度成为一个关键的超参数 - 并且将取决于数据/任务。

要获得整体异常分数,您可以使用任何标准统计数据来合并各个窗口的分数。首先要尝试一个简单的方法,但还有更多方法