我目前正在尝试将无标度(“大”)图(大约 20k 顶点,500k 边)划分为适当的子图。在推导出图的拉普拉斯算子后,我尝试运行一种基于谱间隙和 Fiedler-vector 的方法,然而,并不出人意料的是,大多数情况下顶点估值(即相应特征向量的分量)接近于零节点。显然,图中没有明显的切割。
尽管如此,即使只是为了表明几种方法在遵循我正在研究的光谱特征的图上失败,我还是想进一步探索光谱聚类方法——其中一些需要一个固定的 k 来表示分区。
我知道在 k-means-clustering 方面使用 BIC 和 AIC。我感兴趣的是,这些标准是否也用于谱图聚类领域?是否有任何理由允许在图谱和 BIC 和 AIC 等模型选择标准之间建立联系?
非常感谢任何输入!
补充:
所以,我进行了一些测试。我已经尝试了 RSB 与截止值 c 的中位数。我使用高证据(低误报率,可能高误报率)集群数据来验证(大约 250 个非重叠组),以一种相当“穷人”的方式,所以没有什么特别的。最初的削减已经影响了超过 235 个集群,尽管其中许多实际上相当小(我们在这里谈论的是平均约 75 个)。我尝试通过 MAD 偏离中位数(朝向绝对值最高的估值),这也导致了糟糕的表现。经过进一步的尝试,我最终选择了估值分布的第 1 或第 3 分位数,这允许进行一些较小且相当微不足道的削减。尽管如此,
为了计算它们,我使用了 ARPACK (IRLM),所以我希望结果在双精度方面相当准确。这是前 2 次迭代(都产生 2 个集群,每个集群大约 36 个节点)之后的特征估值图(log2,只是快速和肮脏) - 核心似乎太密集了。

我考虑过至少购买范仲最近关于谱聚类(spectral clustering)的书,因为我喜欢阅读之前的作品(至少前两章)。它们干到骨子里,但仍然提供了很多信息。