我有一个电子商务网站,客户可以直接从该网站购买商品。我有训练数据,其中包括订单 ID、用户 ID、订单号、自上次订单以来的天数、产品 ID、添加到购物车订单、重新订购...
我试图预测,对于每个用户,他将在下一个订单中购买什么商品。我尝试使用朴素贝叶斯、每个用户的平均购买项目和以下等式:posterior ~ Bayes Factor x prior但预测结果不好,并且有很多误报和/或负数。
也许我可以尝试先训练用户将购买的物品数量,然后训练他将获得的特定物品,但不确定是否会得到更好的结果。我认为这可以用于多标签分类,但之前没有在分类中使用多标签。
我正在使用 python 和 sklearn,pandas ......
我可以使用任何更好的模型以及如何训练和预测可变多标签以及我是否可以在 sklearn 中做到这一点?请记住,数据很大,不幸的是,使用 sklearn 中的一些分类算法进行预测会占用大量内存,因此,任何关于如何减少内存消耗的想法也将是有用的。