我的数据采用样本中每个客户的事件流的形式。对于给定的客户,流采用随时间变化的事件列表的形式:
- 在 T1,客户 C1 购买了 1 单位产品 X
- 在 T2,客户 C2 购买了 1 单位产品 X
- T3时,客户C1联系客服
- 在 T9,客户 C1 购买了 3 件产品 Y,以此类推。
我试图根据他们以前的历史来预测客户是否会在未来 3 个月内再次购买。
我读过并尝试过的大多数方法都涉及命题化:也就是说,计算一些关于流的汇总统计数据并将其输入到传统的决策树或神经网络中。例如,
客户 1:上个月平均购买 = 34 美元,购买之间的平均时间 = 6 天,自上次购买以来的时间 = 25 天,过去 6 个月的购买量斜率 = -0.45
客户 2:上个月平均购买 = 64 美元,购买之间的平均时间 = 20 天,自上次购买以来的时间 = 5 天,过去 6 个月的购买量斜率 = +0.05
ETC
虽然这已经产生了一些有用的模型,但我不禁觉得我只使用摘要的统计信息会丢失很多信息。
是否有任何机器学习技术能够从流本身中学习?
是否有任何好的入门资源来开发一个能够构建和更新一组规则的本土人工智能系统,因为新数据来自每个客户的流?