我有一个零售交易数据集,其中不同的用户一起购买某些商品。例如,用户A同时购买了牙膏、牙刷和牙线,用户B同时购买了牙膏、洗发水和香皂。
我需要为数据集中的每个项目找出经常与它一起购买的项目列表。例如,人们可能期望每当购买牙刷时,牙膏可能是经常与它一起购买的物品之一。
我尝试使用Apriori 算法,但这只会给我一组一起购买的物品,或者我不知道是否可以对其进行修改以预测数据集中物品列表的频繁购买。
我可以在这里使用哪种其他算法?
我有一个零售交易数据集,其中不同的用户一起购买某些商品。例如,用户A同时购买了牙膏、牙刷和牙线,用户B同时购买了牙膏、洗发水和香皂。
我需要为数据集中的每个项目找出经常与它一起购买的项目列表。例如,人们可能期望每当购买牙刷时,牙膏可能是经常与它一起购买的物品之一。
我尝试使用Apriori 算法,但这只会给我一组一起购买的物品,或者我不知道是否可以对其进行修改以预测数据集中物品列表的频繁购买。
我可以在这里使用哪种其他算法?
最简单的方法是建立一个矩阵来表示两个项目在一起的频率:是多少次项目的计数和一起购买(请注意,您只需要填充对角矩阵,因为它是对称的)。
从那里你可以计算你需要的任何东西:最常见的用给定物品购买的物品,一般最常见的项目对等。
您还可以将矩阵视为图形表示,并使用特定于图形的算法。