我正在研究基于客户属性(例如人口统计)和过去的产品交互(例如购买或未购买)向客户推荐产品的方法。有大约 250 种产品可供推荐。这当然是一个隐式反馈推荐引擎设置。
我有两个问题与分解机的使用有关。
1) 为该算法构建数据的唯一方法是为每个客户/产品交互创建 1 行,其中包含客户属性的列和正在考虑的产品的单热编码矩阵?包含用于目标列的 1/0。这将是一个非常稀疏的矩阵,例如 libsvm 格式。如果客户和产品的每种组合不可行,则将包括所有积极的互动(客户购买)和每个客户的负面示例样本。
2)一旦建立模型......如何提供建议?是否必须为每个客户遍历所有产品(变体)?这似乎令人望而却步。
虽然这被描述为产品推荐,但广告技术中的点击模型将是另一种常见情况。想知道人们在现实世界中是如何处理这个问题的吗?