为什么我们要在光谱聚类中构建拉普拉斯图?
机器算法验证
机器学习
聚类
光谱分析
2022-03-22 10:18:57
2个回答
邻接矩阵的特征值集是对应图的谱。谱是研究两个图之间相似性的一个非常重要的因素。如果两个图相似,那么一个的邻接矩阵可以看作是在另一个上实现的置换算子,因此它们的特征值相同(注意两个矩阵具有相同的特征值并不一定导致两个图相似) .
因此,如果我们通过分配一个函数将每个图节点映射到一个值对他们来说,邻接矩阵的特征向量可能是一个不错的选择(这也是在谱聚类过程中计算特征向量的原因)。也可以写成矩阵形式
如果我们一起考虑关联矩阵,这样的图映射将是:
这映射在边缘上,并且, 只是, 将通过再次映射每个节点来映射到图上:
我将尝试给出更易于理解的(补充)答案。
谱聚类有两个步骤。首先,您确定特征向量之间的邻域边缘(告诉您两个这样的向量是否相似),产生一个图。
然后你把这张图“嵌入”或“重新排列”在一个 d 维的欧几里得空间中。这种嵌入的每个维度都试图为优化问题提供解决方案。通俗地说,这个优化问题是最小化出现在 0 相对两侧的相邻图节点的数量(受空间填充约束)。因此,每个节点往往会靠近其邻居(由图结构决定),这可能是 K-means 工作的更友好空间。
如果您进行数学运算,事实证明拉普拉斯 L 的特征向量为这个优化问题的“松弛”版本提供了解决方案 - 就是这样。
其它你可能感兴趣的问题