此数据的异常值检测

数据挖掘 机器学习 数据挖掘 异常检测 离群值
2022-02-14 15:12:24

我有一个向量,想检测其中的异常值。

我需要一种异常值检测方法(一种非参数方法),它可以将红点检测为异常值。 在此处输入图像描述

编辑:我有很多这样的向量。模式与此类似,但值不同。我的意思是我们可以看到高度,因为这些值不是恒定的,但总体而言,异常值与正常数据的模式是这样的。这意味着它们在一个地方打破了布鲁斯点的连续性并朝着不同的方向前进。这是另一个数字。 在此处输入图像描述 提前致谢。

1个回答

不确定这是否是时间序列数据,但看起来可能是。

对于任何给定的狭窄时间窗口,都有一个分布看起来像它的中心位置略高于 y=200,并且具有相当稳定的分布。所以无论那个分布是什么,这就是你的模型。

然后监视最近的窗口,并将其视为样本。对模型执行拟合优度检验。如果失败,则窗口中的点是异常的。

更新:根据您所说的大约代表一分钟时间的数据,看起来您可以使用大约 1 秒宽的窗口。运行假设检验以查看窗口中的数据是否来自典型分布,如果不是,则将该窗口中的所有点标记为异常。如果您需要比 1s 更精细的分辨率,只需缩小窗口即可。