我有这些数据,我需要检测异常值。
异常值在边界上清晰可见(开始和结束,红色)。而且我只关心开始或结束时出现的异常值。

我可以很容易地制定一个规则,“所有超过 10 的值都是异常值”,但我不能保证距离总是超过 10。
我也可以说“点之间的大距离意味着异常值”,但同样,说什么是“大距离”是任意的。
此外,与主流数据(蓝色)相比,部分合法数据(绿色)具有一些异常值特征。
我一直在检查一些用于检测异常值的算法,但它们总是假设有问题,比如高斯分布,或者只是对超过 75% 的所有四分位数声明“异常值”。
是否有更通用的异常值检测标准?