哪些图形属性对预测分析有用?

数据挖掘 推荐系统 预测建模 图表
2022-03-07 21:18:41

假设我正在为在线内容构建一个内容推荐引擎。我有可以导入图表的网络日志数据,其中包含用户 ID、他们查看的页面以及他们查看时的时间戳。本质上,它是每个用户查看过哪些页面的历史记录。

我使用 Neo4J 和 Cypher 编写了一个简单的遍历算法。对于我要为其构建推荐的每个页面(节点),我会发现哪些页面在其他访问过该页面的用户中最受欢迎。这似乎给出了不错的结果。但是,我想探索替代方法,看看哪种方法给出了最相关的建议。

除了我的简单遍历之外,我很好奇是否有图级属性可以用来用这个数据集构建另一组建议。我看过SNAP,它有一个很好的算法库,用于 Page Rank、Clauset-Newman-Moore 社区检测、Girvan-Newman 社区检测、中介中心性、K 核心等算法。

有很多算法可供选择。你在哪些算法上取得了成功?你会考虑尝试哪个?

1个回答

使用社区检测,您可以构建推荐系统。这个领域最常用的算法是Blondel 算法,你可能在 SNAP 中看到过。Blondel 几乎是被广泛接受的社区检测算法中最快的,它的结果相当可接受(至少根据模块化得分)。作为旁注,您可能还想查看 NetworkX 和 igraph 库以了解更多图形算法和可视化。

希望对你有帮助,祝你好运。