训练分类器检测波峰

数据挖掘 深度学习 时间序列 异常检测
2022-02-25 01:29:54

图中,时间序列中有数据和目标。数据被填充直到达到最大长度。目标由人类标记。它确定了脉冲的起点和终点。

第一个想法是将时间序列编码为类似文本的 DNA 序列,然后对其进行机器翻译。我的灵感来自英语和德语翻译(又名单词替换)。

2021 年 5 月 27 日更新:我在kaggle
中发现了一个类似的实验

问题:

假设我在这个数据集上使用 seq2seq 神经网络训练。稍后,我使用相同的数据进行测试,但将时间移到右侧 1000 点。是否能够检测到新的起点和新的停止点?

如果不

神经网络可以检测起点和终点吗?

图片

1个回答

作为一般原则:通过拆分成更小的重叠分析窗口来处理序列。窗口长度应略长于您感兴趣的事件。在这样的窗口中,您可以计算表征事件的特征,例如窗口内的最小值和最大值之间的差异。有了这些特性,这里显示的事件应该很容易分离出来。您可以使用标记数据在每个窗口上训练二元分类器,例如逻辑回归或随机森林。