无监督学习问题的异常检测技术有哪些

数据挖掘 异常检测
2022-03-11 03:14:20

我有数百万没有标签的足够且格式正确的数据我必须找出异常。

听说过隔离森林、马氏距离关于识别无监督学习中的异常。这些可以试试吗?

他们还有其他我们可以尝试的技术吗?

谢谢

1个回答

您可以尝试这些技术等等。-所有异常检测技术

正如文章中所讨论的,这些是异常值检测技术。您在寻找异常值吗?最好得到一些已知的异常并建立分类。

如果无法进行监督,请尝试采用以下方法之一-

ABOD 用于识别高维数据中的异常

聚类是否应该基于距离或密度来查找异常值(异常)

基于连通性的异常值检测技术

还有其他技术,例如基于 PCA、基于回归、自动编码器、knn、加权 Knn 甚至自组织图 (SOM)。如果您需要更多信息,请告诉我。

Imp - 在开始机器学习之前更好地了解您的异常情况,我已经体验到,即使是 qq 图或仅 3sd 之外的数据点也可能会提供更好的异常检测。