为什么我们要在光谱聚类中构建拉普拉斯图?

机器算法验证 机器学习 聚类 光谱分析
2022-03-22 10:18:57

从相似矩阵创建拉普拉斯矩阵在谱聚类中给我们带来什么优势?我们为什么要创造它?

这是算法:

在此处输入图像描述

2个回答

邻接矩阵的特征值集是对应图的谱。谱是研究两个图之间相似性的一个非常重要的因素。如果两个图相似,那么一个的邻接矩阵可以看作是在另一个上实现的置换算子,因此它们的特征值相同(注意两个矩阵具有相同的特征值并不一定导致两个图相似) .

因此,如果我们通过分配一个函数将每个图节点映射到一个值f对他们来说,邻接矩阵的特征向量A可能是一个不错的选择(这也是在谱聚类过程中计算特征向量的原因)。也可以写成矩阵形式

fTAf=eijf(i)f(j)

如果我们一起考虑关联矩阵,这样的图映射将是ff

(f)(eij)=f(vj)f(vi)

这映射在边缘上,并且L=DA, 只是T, 将通过再次映射每个节点来映射到图上:

(Lf)(vi)=vjviwij(f(vi)f(vj))

我将尝试给出更易于理解的(补充)答案。

谱聚类有两个步骤。首先,您确定特征向量之间的邻域边缘(告诉您两个这样的向量是否相似),产生一个图。

然后你把这张图“嵌入”或“重新排列”在一个 d 维的欧几里得空间中。这种嵌入的每个维度都试图为优化问题提供解决方案。通俗地说,这个优化问题是最小化出现在 0 相对两侧的相邻图节点的数量(受空间填充约束)。因此,每个节点往往会靠近其邻居(由图结构决定),这可能是 K-means 工作的更友好空间。

如果您进行数学运算,事实证明拉普拉斯 L 的特征向量为这个优化问题的“松弛”版本提供了解决方案 - 就是这样。