我正在创建一个推荐系统,并希望将“相似”用户的评分和项目的特征结合起来。输出是预测等级 [0-1]。我正在考虑使用神经网络(开始)。
因此,输入是项目特征和每个用户评分的组合。对于项目 A 和用户 1,系统可以在组合数据 A1 上进行训练。这将是一个训练示例。
如果用户 1 也评价了电影 B 怎么办?那么数据 B1 也可以作为训练样本吗?以这种方式重复使用用户 1 的特征进行训练有问题吗?
您对解决问题的更好方法有什么建议吗?
我正在创建一个推荐系统,并希望将“相似”用户的评分和项目的特征结合起来。输出是预测等级 [0-1]。我正在考虑使用神经网络(开始)。
因此,输入是项目特征和每个用户评分的组合。对于项目 A 和用户 1,系统可以在组合数据 A1 上进行训练。这将是一个训练示例。
如果用户 1 也评价了电影 B 怎么办?那么数据 B1 也可以作为训练样本吗?以这种方式重复使用用户 1 的特征进行训练有问题吗?
您对解决问题的更好方法有什么建议吗?
为什么在完全理解问题之前考虑使用神经网络?
用于协同过滤的标准矩阵分解方法能够轻松利用内容特征。有关如何在贝叶斯设置中完成此操作的示例,请参阅Matchbox 论文。
三篇关于将矩阵分解与内容特征相结合的论文(这里是专门的主题模型):
我也会宣传我自己的博客文章,稍微讨论一下这个问题: Topic Models meet Lantent Factor Models
不需要神经网络方法,协同过滤本身就是一种算法。具体针对您的问题,对 cf 和 recomender system 有很好的描述:
(寻找 XVI:推荐系统)。它优雅、简单,如果你做得对(即使用矢量化形式、快速最小化器和准备好的渐变),它可以非常快。