异常检测警报系统

数据挖掘 爪哇 异常检测
2022-02-15 08:10:26

我需要设计和实施我的第三年项目,这是一个实时警报系统,供父母使用智能手机保护孩子的安全。

我的数据是基于时间且不受监督的,这意味着我没有任何事件的得分,它包含来自以下的事件:

  • 移动浏览(http 请求)
  • 全球定位系统坐标
  • 通话(拨出和拨入)

我应该选择基于集群/基于密度的方法吗?如何在机器学习的帮助下找到应通知父母的罕见和可疑事件?

关于如何以视觉方式呈现结果的任何建议?

一周的数据足够训练吗?

Java中是否有任何好的开源来检测异常?

1个回答

我应该选择基于集群/基于密度的方法吗?

是的,但取决于算法有多好,以及算法识别重要集群的效率如何。很多文献表明人们采用了聚类方法。

如果我采用聚类方法,我会采用层次聚类技术,因为它可以帮助我重新检查我的集群并在其中建立层次结构,以便也可以探索欺诈的严重性。

如何在机器学习的帮助下找到应通知父母的罕见和可疑事件?

我会指出一个我为一个非常相似的问题写的答案,它也探讨了欺诈检测和异常分析的方面。正如我在回答中所说,遗传算法在欺诈检测方面仍然很强大,因为它是数据点适应度计算的巧妙方法。

关于如何以视觉方式呈现结果的任何建议?

通常此类图表通过饼图和网络图呈现。如果您对设计和美学有很好的想法,您也可以使用信息图表。

一周的数据足够训练吗?

通常,Paypal、Palantir 等公司的数据科学团队会搅动多年的数据以获得明智的见解。正如你所说的这是一个班级项目,几个月的数据应该会很好。您不会从一周的数据中真正得到任何可疑或明智的信息。

Java中是否有任何好的开源来检测异常?

是的有一些:

  1. 遗传算法库
  2. java中的分布式在线机器学习框架