我在无事实表中有事件数据集。它有事件列表
timestamp-> event name -> node ( In network)
总是有一系列事件发生。那么如何根据过去的事件开始预测未来的事件并发现将受过去经验影响的节点列表。
我是没有机器学习知识的程序员。我已经安装了 spark、R 并在 oracle 数据库中有数据集。是否有任何教程/算法可以用来入门。我自学了 scala/R,但不知道如何开始。我的数据集很大,即 3 个月内超过 90 亿行。
Node Eventtime alarmname
192.168.1.112 6/14/2016 19:41 Main power supply has a fault alarm
192.168.1.113 6/14/2016 19:23 Association path broken
192.168.1.113 6/14/2016 19:23 NA
192.168.1.113 6/14/2016 19:23 Association broken
192.168.1.112 6/14/2016 19:23 Mains Failure
192.168.1.112 6/14/2016 19:23 Mains Failure
附加信息:
我有 98 个节点。我想预测:
一世。单个节点宕机时有报警或宕机的节点数 例如,如果节点 A 有报警,如果在 1 个月内同时有报警的节点列表
ii. 事件发生的顺序,即如果一个节点发生电源故障,那么下一个事件将是节点停机。