我有兴趣识别在感兴趣的事件之前发生的事件(模式)。
例如,客户打电话投诉或客户在线查看余额,然后客户关闭帐户(感兴趣的事件)。数据是带有时间戳的一系列事件的形式。
我想知道人们使用什么方法(和软件)来完成这样的任务。
我对确切的模式(事件的顺序)、事件的频率(多次致电投诉)和事件的时间(80% 的事件 A 直接导致 X 天内感兴趣的事件)持开放态度。基本上,对人们用来识别导致事件的模式的任何方法持开放态度。
到目前为止,我在 RCSPADE的包中找到了可用的算法arulesSequences。它似乎能够识别模式序列以及哪些项目同时出现。但是,我认为无法为其设置目标事件以找到模式。
我对 R、Python 或 SAS 中可用的算法持开放态度。
非常感谢!