我有数百万没有标签的足够且格式正确的数据。我必须找出异常。
听说过隔离森林、马氏距离关于识别无监督学习中的异常。这些可以试试吗?
他们还有其他我们可以尝试的技术吗?
谢谢
我有数百万没有标签的足够且格式正确的数据。我必须找出异常。
听说过隔离森林、马氏距离关于识别无监督学习中的异常。这些可以试试吗?
他们还有其他我们可以尝试的技术吗?
谢谢
您可以尝试这些技术等等。-所有异常检测技术
正如文章中所讨论的,这些是异常值检测技术。您在寻找异常值吗?最好得到一些已知的异常并建立分类。
如果无法进行监督,请尝试采用以下方法之一-
还有其他技术,例如基于 PCA、基于回归、自动编码器、knn、加权 Knn 甚至自组织图 (SOM)。如果您需要更多信息,请告诉我。
Imp - 在开始机器学习之前更好地了解您的异常情况,我已经体验到,即使是 qq 图或仅 3sd 之外的数据点也可能会提供更好的异常检测。