假设我正在为在线内容构建一个内容推荐引擎。我有可以导入图表的网络日志数据,其中包含用户 ID、他们查看的页面以及他们查看时的时间戳。本质上,它是每个用户查看过哪些页面的历史记录。
我使用 Neo4J 和 Cypher 编写了一个简单的遍历算法。对于我要为其构建推荐的每个页面(节点),我会发现哪些页面在其他访问过该页面的用户中最受欢迎。这似乎给出了不错的结果。但是,我想探索替代方法,看看哪种方法给出了最相关的建议。
除了我的简单遍历之外,我很好奇是否有图级属性可以用来用这个数据集构建另一组建议。我看过SNAP,它有一个很好的算法库,用于 Page Rank、Clauset-Newman-Moore 社区检测、Girvan-Newman 社区检测、中介中心性、K 核心等算法。
有很多算法可供选择。你在哪些算法上取得了成功?你会考虑尝试哪个?