协同过滤的基准数据集

数据挖掘 数据集 推荐系统
2021-09-25 07:00:46

我想测试一种新的协同过滤算法。一个典型的用例是根据与特定用户相似的用户的偏好来推荐电影。

研究人员经常使用哪些常见的基准数据集来测试他们的算法?我知道在计算机视觉中人们经常使用 MNIST 或 CIFAR,但我还没有找到用于协同过滤的类似数据集。

2个回答

显而易见的答案是 Netflix 奖品数据集,对此进行了大量研究,并且大多数 CF 算法在其中都有已知分数。

还有其他可用的数据集通常用作基准:

我有一个可以帮助你的存储库。

https://github.com/ArthurFortes/Datasets-for-Recommneder-Systems/