使用商店购买历史确定相关的产品类别

数据挖掘 聚类
2022-03-11 14:45:56

我有一个包含产品购买历史的大型数据集,如下所示:

userID  productID   category        subcategory
123     ABC         Kitchen         Knives
123     BEA         Kitchen         Organization
233     ZZS         Electronics     Phones

对于第一个项目,我希望回答这个问题:“购物者倾向于购买哪些离散的类别/子类别组?”。例如,我们可能会发现购买显示器的购物者也很有可能购买键盘和鼠标。

任何关于开始解决此类问题的方向都值得赞赏!

2个回答

这是经典的购物篮分析

聚类是一个很好的工具,你需要频繁的项目集挖掘和关联规则。

https://en.wikipedia.org/wiki/Association_rule_learning

这个问题类似于 twitter 标签聚类问题。您可以阅读相关文献以获取许多想法。

我个人的开始方法是构建一个网络,category使每个独特的类别都是一个节点,并且通过计算购买这两种产品的客户数量来确定一对类别之间的强度。然后您可以查看图论中的一些社区检测算法,以根据对的强度形成类别集群。您可以重复类似的分析subcategory并创建 的组合变量category-subcategory