我有杂货店购物的购买历史数据。我试图在某些条件下获得异常频繁购买的物品。例如,当客户在线购物并愿意支付额外的运费时,我试图找到经常购买的商品。
为了找到在这种情况下特别(或异常)频繁购买的物品(通过支付运费通过在线商店),我应该如何以及使用什么机器学习算法来识别这些物品?
我找到arules
了使用带有购买历史的关联规则的 R 包并尝试应用它。但似乎该软件包可能基于与我的想法不同的原理。
有人对我的问题有想法吗?如果有与问题相关的 R 包,那就完美了。
我有杂货店购物的购买历史数据。我试图在某些条件下获得异常频繁购买的物品。例如,当客户在线购物并愿意支付额外的运费时,我试图找到经常购买的商品。
为了找到在这种情况下特别(或异常)频繁购买的物品(通过支付运费通过在线商店),我应该如何以及使用什么机器学习算法来识别这些物品?
我找到arules
了使用带有购买历史的关联规则的 R 包并尝试应用它。但似乎该软件包可能基于与我的想法不同的原理。
有人对我的问题有想法吗?如果有与问题相关的 R 包,那就完美了。
让我们从具体问题开始,然后讨论一般问题。
一个)
具体问题“通过支付运费找到通过在线商店购买的特别频繁的商品”需要很少或不需要应用人工智能,只需要一些统计数据。
该问题涉及“购买的物品”和“购买方法”,因此,我们有一个信息数据库,其中包含以下条目:
销售(在线,第 1 项)。
销售(商店,项目 2)。
销售(在线,第 2 项)。
销售(在线,第 2 项)。
...
(笔记记录可重复)
商品“X”的在线销售额百分比定义为该商品的在线销售额,sale(online,X),占该商品的总销售额,sale(_,X):
在前面的数据示例中,p(item1)=1/1,p(item2)=2/3。
高 p(X) 表示在线购物首选的商品。
可以为类似情况定义其他概率。
b)
关于一般情况,我们谈论的是数据挖掘。对他们来说是非常好的软件包(开源,...):weka,IBM DWE,...。例如,在定义为的数据库上使用 Weka J48:
销售(购买标识符,购买方法,项目)
其中“purchase_identifier”必须对已在单次买断(现金票)中购买的项目进行分组。然后,J48 将提供以下回答规则:商品“foo”通常是在网上商店购买的,同时也购买了商品“bar”。