我有一个包含产品购买历史的大型数据集,如下所示:
userID productID category subcategory
123 ABC Kitchen Knives
123 BEA Kitchen Organization
233 ZZS Electronics Phones
对于第一个项目,我希望回答这个问题:“购物者倾向于购买哪些离散的类别/子类别组?”。例如,我们可能会发现购买显示器的购物者也很有可能购买键盘和鼠标。
任何关于开始解决此类问题的方向都值得赞赏!