检测异常斜率增加

数据挖掘 数据挖掘 时间序列
2022-02-12 10:16:24

我有一个响应变量系列,它将基于每秒以固定间隔 [0-100] 随机生成,并且我想在新生成的数据明显大于上一秒的数据时检测到事件,并发送警报消息对我来说。

因此,我计算响应变量的差异除以 1 滞后并除以时间差异(斜率),而不是使用自举来构造响应的 90% 百分位数的 95% 置信区间,如果新数据大于上限,我定义它不寻常。

事实上,我拥有的数据量非常大,而且这些数据更新频繁。因此,重新采样和计算 CI 将是可怕的,即使它可能是解决问题的一种方法。而且看起来不一定要抽样,因为我有大量样本。

有没有更好的办法?谢谢!

1个回答

一种选择是收集 1 个滞后的经验分布(即,在一个时间步内发生了多少变化?)。然后根据此经验分布的百分比设置阈值。

这通常是通过延迟来完成的。异常延迟事件定义为 95% 或 99% 百分位。