我正在使用 Python 进行异常检测开发。
更详细地说,我需要分析时间序列以检查是否存在异常。
异常值通常是峰值,因此与其他值相比,该值非常高或非常低。
主要思想是预测时间序列值,并使用阈值检测异常。
使用误差计算阈值,即实际值减去预测值。
然后,执行误差的均值和标准差。
上限阈值等于平均值 + (5 * 标准差)。
下阈值等于平均值 - (5 * 标准差)。
如果错误超过阈值则标记为异常。
这种方法不起作用的是,如果我在一天内有多个异常值,则不会检测到它们。这是因为误差、均值和标准差受异常值的影响太大。
我该如何解决这个问题?有没有另一种方法可以用来识别没有这个问题的阈值?
谢谢