我有关于商店级购买、面板级购买和会员卡人口统计信息的数据。
在商店购买信息中,数据由一个产品代码组成,该代码可以分配给许多不同产品的品牌/产品(百事可乐、可口可乐、百威等)。以及该产品在该周售出的商品数量以及每种产品的价格。
在面板信息中,我有关于产品代码、按该面板 ID 在每个商店购买的商品数量以及在该商店中购买该产品的总美元数的数据。
在人口统计信息中,我有每个 Panel ID 的数据:- 家庭中有多少人居住,panel_ID 收入,儿童数量,教育等。
我想对产品信息应用条件概率,例如给定 panel_ID 购买的产品A
他们购买产品的概率是多少B
。
然而,对于啤酒数据,我有 250 个不同的品牌和 300,000 多次 Panel_ID 购买。
我正在考虑应用朴素贝叶斯作为起点,但是对于这样的问题,您会建议哪些其他机器学习方法?