R中图的(标签传播算法/频繁子图挖掘)库

数据挖掘 分类 r 图表
2021-10-11 07:50:23

问题的一般描述

我有一个图,其中一些顶点被标记为具有 3 或 4 个可能值的类型。对于其他顶点,类型未知。我的目标是使用该图来预测未标记顶点的类型。

可能的框架

根据我对文献的阅读,我怀疑这符合标签传播问题的一般框架(例如,请参阅本文本文

另一种经常提到的方法是Frequent Subgraph Mining,其中包括SUBDUESLEUTH和等算法gSpan

在 R 中找到

我设法找到的唯一标签传播实现R来自label.propagation.community()igraph但是,顾名思义,它主要用于查找社区,而不是用于对未标记的顶点进行分类。

似乎也有几个对subgraphMining库的引用(例如这里),但看起来它从 CRAN 中丢失了。

问题

您知道用于所描述任务的库或框架吗?

1个回答

这是一篇旧文章,但在 R 中有一个子图包和随附的书籍/文档: https ://www.csc.ncsu.edu/faculty/samatova/practical-graph-mining-with-R/PracticalGraphMiningWithR .html

尽管在这种情况下,我个人并没有得到子图挖掘和标签传播之间的联系。SVD++ 可能更接近您正在寻找的内容(由 Spark 的 GraphX 支持,我认为它也支持标签传播)。 http://spark.apache.org/graphx/