数据挖掘 - 哪些图形属性对预测分析有用？ - 吾爱随笔录

假设我正在为在线内容构建一个内容推荐引擎。我有可以导入图表的网络日志数据，其中包含用户 ID、他们查看的页面以及他们查看时的时间戳。本质上，它是每个用户查看过哪些页面的历史记录。

我使用 Neo4J 和 Cypher 编写了一个简单的遍历算法。对于我要为其构建推荐的每个页面（节点），我会发现哪些页面在其他访问过该页面的用户中最受欢迎。这似乎给出了不错的结果。但是，我想探索替代方法，看看哪种方法给出了最相关的建议。

除了我的简单遍历之外，我很好奇是否有图级属性可以用来用这个数据集构建另一组建议。我看过SNAP，它有一个很好的算法库，用于 Page Rank、Clauset-Newman-Moore 社区检测、Girvan-Newman 社区检测、中介中心性、K 核心等算法。

有很多算法可供选择。你在哪些算法上取得了成功？你会考虑尝试哪个？