这种异常值有什么可靠的标准吗?

计算科学 统计数据
2021-12-22 16:24:12

我有这些数据,我需要检测异常值。

异常值在边界上清晰可见(开始和结束,红色)。而且我只关心开始或结束时出现的异常值。

屏幕截图

我可以很容易地制定一个规则,“所有超过 10 的值都是异常值”,但我不能保证距离总是超过 10。

我也可以说“点之间的大距离意味着异常值”,但同样,说什么是“大距离”是任意的。

此外,与主流数据(蓝色)相比,部分合法数据(绿色)具有一些异常值特征。

我一直在检查一些用于检测异常值的算法,但它们总是假设有问题,比如高斯分布,或者只是对超过 75% 的所有四分位数声明“异常值”。

是否有更通用的异常值检测标准?

1个回答

如果您显示的直方图比图像处理中用于二值化的方法具有代表性。

例如,使用Otsu 方法可能是设置您所追求的阈值的可靠方法。

在此处输入图像描述