我最近使用了一种预测算法来尝试预测用户愿意使用 ALS(矩阵分解)与项目交互的程度,但我必须将多个属性“压缩”为一个,为这些值确定一些任意权重才能能够计算要使用的评级。
它可以工作(有点),但我认为这绝对是错误的,因为手动加权属性是静态的,并且不能动态地适应数据本身。
我正在考虑切换到分布式随机森林算法,但即使它会(随机)使用所有属性,它们也不会一起使用,这使得它不适合我的目的。
在我的研究中,我发现循环神经网络可能适合我想要实现的目标,但在关注它们之前,因为我不是该领域的专家,我想提出一些建议:)
可能我可以利用 RNN 的时间序列特性,但现在我更喜欢专注于支持我拥有的一组属性。
目前,ALS 的“评级”是根据以下属性计算得出的:
- 用户查看商品页面的次数
- 用户查看类别页面的次数
- 用户查看子类别页面的次数
- 用户从该类别购买了多少次
- 用户从子类别购买了多少次
- 用户在多长时间前购买了该商品
- 用户多久以前从同一类别购买过东西
- 用户多久以前从同一个子类别购买过东西
(和类似的)
值得尝试使用 RNN 吗?如果是,我应该尝试使用 tensorflow 还是 caffe?
谢谢!