我有一个巨大的数据集,其中包含 3 个变量Company_ID, Area_code, Product_ID,每个变量1500,50,15分别是级别的分类变量,Product_ID正在使用的产品在哪里Company_ID。每家公司都可以位于多个产品中area_code,并且可以使用多个产品。让我们称之为这列火车数据。
给定火车数据中不存在的组合Company_ID, Area_code, Product_ID,
example- comp_025, area_012, p_10我必须预测Company_ID位于该地区的公司Area_Code使用该产品的概率Product_ID。这样我就可以向公司推荐该产品。
我是一个初学者,很难想出一个模型。任何输入都受到高度赞赏。
谢谢你。