我目前正在为每日新闻开发一个推荐系统。首先,我评估了在 Mahout 中实现的所有推荐算法及其相应的设置(例如,相似性、分解器等)。由于我们要为用户推荐每日新闻,所以我们使用两天前收集的每个用户的阅读行为作为训练集,第二天的数据作为测试集。评估的 RMSE 很好,最好的推荐器是 SVD+SGD,所以我们在我们的系统上实现了推荐器,试运行了几天。
然而,结果,实际推荐的消息,对于真实用户来说似乎不是很有吸引力(这里的“不吸引人”是指用户觉得“你为什么向我推荐这个?”)。所以我们决定了另一种方法:使用标签和类别及其关系来做推荐的主要工作,CF的结果只是为了支持。
这让我想知道 CF 是否不适合某种内容。因为我也做过电影和音乐推荐,CF是一个很好的工具。但对于新闻来说,似乎并非如此。
谁能解释为什么会发生这种情况,并就如何选择合适的推荐方法给出一些指导?谢谢:)