有几个用于机器学习分类/回归任务的经典数据集。最受欢迎的是:
但是有人知道用于网络分析/图论的类似数据集吗?更具体 - 我正在寻找用于比较/评估/学习的黄金标准数据集:
- 中心性措施;
- 网络聚类算法。
我不需要大量公开可用的网络/图表,但需要几个实际必须知道的数据集。
编辑:
为“黄金标准数据集”提供确切的特征是相当困难的,但这里有一些想法。我认为,真正的经典数据集应该满足这些标准:
- 文章和教科书中的多个参考文献;
- 包含在著名的网络分析软件包中;
- 足够的存在时间;
- 在许多图形分析课程中的使用。
关于我感兴趣的领域,我还需要为顶点和/或预先计算的(或预定义的)“权威分数”(即中心性估计)标记的类。问了这个问题后,我继续搜索,这里有一些合适的例子:
- Zachary's Karate Club:1977年推出,引用超过1.5k次(根据Google Scholar),顶点有属性Faction(可用于聚类)。
- Erdos Collaboration Network : 不幸的是,我还没有找到这个数据文件形式的网络,但它相当有名,如果有人用数学家的专业数据丰富网络,它也可以用于测试聚类算法。