我需要设计和实施我的第三年项目,这是一个实时警报系统,供父母使用智能手机保护孩子的安全。
我的数据是基于时间且不受监督的,这意味着我没有任何事件的得分,它包含来自以下的事件:
- 移动浏览(http 请求)
- 全球定位系统坐标
- 通话(拨出和拨入)
我应该选择基于集群/基于密度的方法吗?如何在机器学习的帮助下找到应通知父母的罕见和可疑事件?
关于如何以视觉方式呈现结果的任何建议?
一周的数据足够训练吗?
Java中是否有任何好的开源来检测异常?
我需要设计和实施我的第三年项目,这是一个实时警报系统,供父母使用智能手机保护孩子的安全。
我的数据是基于时间且不受监督的,这意味着我没有任何事件的得分,它包含来自以下的事件:
我应该选择基于集群/基于密度的方法吗?如何在机器学习的帮助下找到应通知父母的罕见和可疑事件?
关于如何以视觉方式呈现结果的任何建议?
一周的数据足够训练吗?
Java中是否有任何好的开源来检测异常?
我应该选择基于集群/基于密度的方法吗?
是的,但取决于算法有多好,以及算法识别重要集群的效率如何。有很多文献表明人们采用了聚类方法。
如果我采用聚类方法,我会采用层次聚类技术,因为它可以帮助我重新检查我的集群并在其中建立层次结构,以便也可以探索欺诈的严重性。
如何在机器学习的帮助下找到应通知父母的罕见和可疑事件?
我会指出一个我为一个非常相似的问题写的答案,它也探讨了欺诈检测和异常分析的方面。正如我在回答中所说,遗传算法在欺诈检测方面仍然很强大,因为它是数据点适应度计算的巧妙方法。
关于如何以视觉方式呈现结果的任何建议?
通常此类图表通过饼图和网络图呈现。如果您对设计和美学有很好的想法,您也可以使用信息图表。
一周的数据足够训练吗?
通常,Paypal、Palantir 等公司的数据科学团队会搅动多年的数据以获得明智的见解。正如你所说的这是一个班级项目,几个月的数据应该会很好。您不会从一周的数据中真正得到任何可疑或明智的信息。
Java中是否有任何好的开源来检测异常?
是的有一些: