数据挖掘 - 我们如何定义推荐系统中的缺失评分？ - 吾爱随笔录 - 问答

我们如何定义推荐系统中的缺失评分？

数据挖掘机器学习预测建模推荐系统无监督学习预言

2022-03-12 05:52:43

(user, item and rating)我正在阅读关于在矩阵分解（SVD）的情况下我们需要通过的协同过滤。现在，我的问题是以下形式的数据

User | Item | Rating A | X1 | 1 A | X2 | 3 B | X2 | 4 C | X1 | 3 C | X3 | 2 我们需要将它转换成

U/I | X1 | X2 | X3 A | 1 | 3 | - B | - | 4 | - C | 3 | - | 3

因此，我们需要-在应用之前将所有的替换为预测值svd。现在我想了解预测这种缺失评级的最实用或最常用的方法：我知道遵循粗略的方法，但它们不是价值预测，而只是替换缺失值

用中性评级替换所有缺失值。（如果评分是 1-5，请说 2 或 3）。
替换为电影的平均评分。
替换为该用户的平均评分。ETC...

1个回答

对于使用矩阵分解时的协同过滤，您不必在密集矩阵上使用普通 SVD。在大多数情况下，评分的输入数据集是稀疏的，您的 U/I 评分矩阵将大部分值设置为 0.0。因此，当为输入日期完成 SVD 时，最终推荐将受到影响。

这也是 2006 年 Netflix Prize 竞赛中使用 SGD for MF 发表的主要突破。作者在这里描述了一切。简而言之 - 您仅在所见评级集上计算您的丢失函数，而不是在所有矩阵上（因为所有零或其他值实际上代表未知/未观察到的情况）。因此，自然的选择是对输入数据使用稀疏矩阵。

其它你可能感兴趣的问题

上一篇Tflearn“nan”权重矩阵下一篇矢量输出回归的算法、技术、论文