非正态分布的异常值检测

数据挖掘 异常检测
2022-02-16 03:37:17

在给定非正态分布的情况下,我可以使用哪些技术进行异常检测?我有不到二十个可用的观察结果。

1个回答

我建议使用最近的邻居方法。这种技术是非参数的,因此它不假设您的特征遵循任何给定的分布。可以通过一些 p 值估计来设置新实例被分类为异常的程度。这些技术的计算成本很高,但是由于您的数据集很小,这可能非常适合。


查看:

学习最小音量集 http://www.stat.rice.edu/~cscott/pubs/minvol06jmlr.pdf

基于最近邻图的评分函数的异常检测 https://arxiv.org/abs/0910.5461

用于异常检测的 P 值估计的新统计量 http://ieeexplore.ieee.org/document/6319713/


您还可以使用更基本的异常检测技术,例如广义似然比检验。但是,这有点老派。