在一系列图表中识别持久集群

数据挖掘 机器学习 scikit-学习 聚类 降维 图表
2022-02-21 15:59:37

任务是识别持久集群,即在一系列图中“持久”为集群(倾向于形成集群)的节点组。

这就是我解决问题的方法:我从一系列输入图中形成一个超图,这样每当一条边再次出现时,它的权重就会增加 1。然后,我在加权超图上应用 Walktrap 算法(现在是随机游走取决于权重),并且生成的聚类对应于持久聚类。

另一个想法是进入嵌入空间(嵌入可用于系列中的输入图),然后应用类似的想法:1)在每个输入嵌入上形成聚类,2)形成一个包含所有节点的超图,并且所有节点之间都存在边节点形成一个特定的集群(形成一个团),并且如上所述,每当边缘再次出现时,它的权重增加 1。最后,我应用了 Walktraph 算法。

然而,虽然运行时间相当长,但上述方法并不能产生令人满意的结果(可能这是由于 Walktrap,但大量非持久性数据往往会污染集群)。你对如何解决这个问题有其他想法吗?

0个回答
没有发现任何回复~