使用客户购买历史数据预测特定条件下经常购买的商品

人工智能 机器学习 无监督学习 学习算法 r
2021-10-20 13:30:15

我有杂货店购物的购买历史数据。我试图在某些条件下获得异常频繁购买的物品。例如,当客户在线购物并愿意支付额外的运费时,我试图找到经常购买的商品。

为了找到在这种情况下特别(或异常)频繁购买的物品(通过支付运费通过在线商店),我应该如何以及使用什么机器学习算法来识别这些物品?

我找到arules了使用带有购买历史的关联规则的 R 包并尝试应用它。但似乎该软件包可能基于与我的想法不同的原理。

有人对我的问题有想法吗?如果有与问题相关的 R 包,那就完美了。

1个回答

让我们从具体问题开始,然后讨论一般问题。

一个)

具体问题“通过支付运费找到通过在线商店购买的特别频繁的商品”需要很少或不需要应用人工智能,只需要一些统计数据。

该问题涉及“购买的物品”和“购买方法”,因此,我们有一个信息数据库,其中包含以下条目:

销售(在线,第 1 项)。

销售(商店,项目 2)。

销售(在线,第 2 项)。

销售(在线,第 2 项)。

...

(笔记记录可重复)

商品“X”的在线销售额百分比定义为该商品的在线销售额,sale(online,X),占该商品的总销售额,sale(_,X):

在此处输入图像描述

在前面的数据示例中,p(item1)=1/1,p(item2)=2/3。

高 p(X) 表示在线购物首选的商品。

可以为类似情况定义其他概率。

b)

关于一般情况,我们谈论的是数据挖掘。对他们来说是非常好的软件包(开源,...):weka,IBM DWE,...。例如,在定义为的数据库上使用 Weka J48:

销售(购买标识符,购买方法,项目)

其中“purchase_identifier”必须对已在单次买断(现金票)中购买的项目进行分组。然后,J48 将提供以下回答规则:商品“foo”通常是在网上商店购买的,同时也购买了商品“bar”。