为书籍段落构建推荐器

数据挖掘 推荐系统 矩阵分解
2022-03-10 00:43:46

我有一些应用程序提供一本书供阅读。用户通常只阅读其中的一些段落(它包含 +6000 段)。

查看scatter用户与段落: 在此处输入图像描述

你可以看到是半均等分布的。使用 SVD 算法进行矩阵分解给出了半随机预测。我总共有 18k 条用户阅读段落的记录。寻找用户,似乎用户正在阅读半随机集(即很难为单个用户阅读指定共同主题)

你能建议我如何产生与每个用户相关的建议吗?

1个回答

您必须提出每个段落的元数据集,然后基于该元数据创建基于内容的推荐系统。如果你有大量的用户数据,你也可以做一个基于社区的推荐系统。

至于元数据集,您可以使用诸如 n-gram 之类的东西来“总结”每个段落,然后为每个段落设置一个索引。从那里,你会知道人们喜欢什么,然后通过算法选择人们最感兴趣的 n-gram,并找到与这些 n-gram 对应的段落。