进行新闻推荐的各种方法

数据挖掘 推荐系统 可能性 朴素贝叶斯分类器 低密度脂蛋白 贝叶斯网络
2022-02-16 08:54:31

我是 ML 的初学者(我只完成了 Andrew Ng 的 ML 课程),我必须致力于新闻推荐。

我浏览了这篇论文,其中提到了用于新闻推荐的不同方法(第 7 页),其中大多数都使用某种概率方法(贝叶斯网络、潜在狄利克雷分配、朴素贝叶斯模型、概率矩阵分解模型)。此外,一些新闻推荐是基于多臂老虎机问题(例如雅虎的首页)。我对这些方法的了解为零。

我对下一步应该做什么感到非常困惑。现在,我计划采用一种非常基本的混合方法(使用协同过滤和基于内容的过滤)。但似乎我很快就要探索这些领域,那么探索这些领域的好策略(和资源)是什么?

2个回答

推荐系统本身就是一个巨大的话题,不用说,大量的研究正在进行中。

本书深入探讨了推荐系统,可能不是你想要的,但它作为参考很有帮助。您似乎不确定这些术语的含义。Berekely AI 课程涵盖了这些主题中的大部分,并且他们的讲座是免费提供的

看完上面的一些资料,你或许可以做出更好的选择。

决定一个好的策略的最好方法是通过以下两种方式来看待这个:-

  • 从评分方法(不推荐):您可以使用您的数据集测试所有上述算法,并检查哪个给出最好的分数。您可以使用 Sci-Kit Learn 之类的工具来实现所有这些算法,并使用与您的数据集相对应的得分最高的算法并使用该算法。缺点是有时即使得分非常高,数据集也可能与该算法不一致,我的意思是尽管得分很高,但您可能无法获得想要的结果。这就是我不推荐这个的原因。
  • 从面向数据集的方法:对于这种方法,您必须仔细研究您的数据集。即使从基于内容的过滤开始也不是一个坏主意。但是根据您的需求和在特定情况下提高精度的必要性,将确保您探索算法来解决该特定问题。这样你就不会用所有不必要的算法给自己压力。您可以开始使用朴素贝叶斯,因为它很容易理解,然后根据您在推荐中的需要,您用于提供推荐的功能从那里选择它。所有这些因素都会发挥作用。通过这种方式,您可以探索使模型更高效所需的方法。