什么是光谱聚类?
数据挖掘
聚类
2021-10-14 10:10:02
2个回答
谱聚类是一种数据聚类算法,它使用数据的相似性矩阵的谱(特征值)在进行较少维度的聚类之前进行降维。
相似度矩阵包括可用数据集中每对点的相对相似度。
谱聚类是一系列算法,用于处理具有复杂网络表示的较大数据集。“大”是指“超过几千个节点但不是巨大的”。您链接到的幻灯片说数学理论是自 1970 年代以来针对无向图开发的。有向图和无向图存在扩展(请参阅您链接到的教程中的幻灯片 20/20)。
对于一些背景,也许阅读第 11 章,特别是 MEJ Newman 的书“网络”的 11.2 和 11.5。11.2 章节标题称为“将网络划分为集群”。 第 11.5 章是“光谱 [图] 分区” - 根据您链接到的http://ranger.uta.edu/~chqding/Spectral/spectralA.pdf中的幻灯片 20,光谱聚类演化的方法。
厚(800页)的书《网络》是跨学科的介绍,而且很冗长,从基础开始。然而,本书讨论了除聚类之外的许多其他事情。它也不在线,也许通过馆际互借获得。
我也喜欢 Andrew Ng 等人 2002 年短论文“关于谱聚类:分析和算法”的介绍,参见“ https://ai.stanford.edu/~ang/papers/nips01-spectral.pdf
...尽管取得了经验上的成功,但不同的作者仍然不同意使用哪些特征向量以及如何从中派生聚类 [...] 此外,对这些算法的分析 [...] 集中在仅使用一个特征向量的简化算法上一次”
但这是 2002 年,从那时起可能发生了很多变化。
其它你可能感兴趣的问题