我们如何定义推荐系统中的缺失评分?

数据挖掘 机器学习 预测建模 推荐系统 无监督学习 预言
2022-03-12 05:52:43

(user, item and rating)我正在阅读关于在矩阵分解(SVD)的情况下我们需要通过的协同过滤。现在,我的问题是以下形式的数据

User | Item | Rating A | X1 | 1 A | X2 | 3 B | X2 | 4 C | X1 | 3 C | X3 | 2 我们需要将它转换成

U/I | X1 | X2 | X3 A | 1 | 3 | - B | - | 4 | - C | 3 | - | 3

因此,我们需要-在应用之前将所有的替换为预测值svd现在我想了解预测这种缺失评级的最实用或最常用的方法:我知道遵循粗略的方法,但它们不是价值预测,而只是替换缺失值

  1. 用中性评级替换所有缺失值。(如果评分是 1-5,请说 2 或 3)。
  2. 替换为电影的平均评分。
  3. 替换为该用户的平均评分。ETC...
1个回答

对于使用矩阵分解时的协同过滤,您不必在密集矩阵上使用普通 SVD。在大多数情况下,评分的输入数据集是稀疏的,您的 U/I 评分矩阵将大部分值设置为 0.0。因此,当为输入日期完成 SVD 时,最终推荐将受到影响。

这也是 2006 年 Netflix Prize 竞赛中使用 SGD for MF 发表的主要突破。作者在这里描述了一切。简而言之 - 您仅在所见评级集上计算您的丢失函数,而不是在所有矩阵上(因为所有零或其他值实际上代表未知/未观察到的情况)。因此,自然的选择是对输入数据使用稀疏矩阵。