数据挖掘 - 预测购买产品的概率 - 吾爱随笔录

我有一个巨大的数据集，其中包含 3 个变量Company_ID, Area_code, Product_ID，每个变量1500,50,15分别是级别的分类变量，Product_ID正在使用的产品在哪里Company_ID。每家公司都可以位于多个产品中area_code，并且可以使用多个产品。让我们称之为这列火车数据。

给定火车数据中不存在的组合Company_ID, Area_code, Product_ID，
example- comp_025, area_012, p_10我必须预测Company_ID位于该地区的公司Area_Code使用该产品的概率Product_ID。这样我就可以向公司推荐该产品。

我是一个初学者，很难想出一个模型。任何输入都受到高度赞赏。

谢谢你。