我已经设置了 300,000 行包含信用卡交易的行,我的工作是在这些数据集中查找异常值(可疑交易)。
我创建了大约 5 个功能(所有连续数据,以 1 列作为事务 ID)
我需要返回所有交易 ID 的列表,这看起来很可疑
我试过什么
我曾尝试使用 K 均值算法,但它不适合我笔记本电脑的内存(8 GB)并且它崩溃了。
我想尝试 1 类 SVM,但我没有看到任何好的教程让我开始。我尝试了 scikitlearn 官方教程,但它已经添加了异常值,他们只是在绘制它。
如何自动检测异常值并返回这些观察结果?