机器算法验证 - 为什么我们要在光谱聚类中构建拉普拉斯图？ - 吾爱随笔录

机器算法验证机器学习聚类光谱分析

2022-03-22 10:18:57

从相似矩阵创建拉普拉斯矩阵在谱聚类中给我们带来什么优势？我们为什么要创造它？

这是算法：

在此处输入图像描述

2个回答

邻接矩阵的特征值集是对应图的谱。谱是研究两个图之间相似性的一个非常重要的因素。如果两个图相似，那么一个的邻接矩阵可以看作是在另一个上实现的置换算子，因此它们的特征值相同（注意两个矩阵具有相同的特征值并不一定导致两个图相似） .

因此，如果我们通过分配一个函数将每个图节点映射到一个值 $f$ 对他们来说，邻接矩阵的特征向量 $A$ 可能是一个不错的选择（这也是在谱聚类过程中计算特征向量的原因）。也可以写成矩阵形式

f^{T} A f = \sum_{e_{i j}} f (i) f (j)

$\mathbf{f}^T \mathbf{A} \mathbf{f} = \sum_{e_{ij}} f(i) f(j)$

如果我们一起考虑关联矩阵，这样的图映射将是 $f\rightarrow\nabla f$ ：

(\nabla f) (e_{i j}) = f (v_{j}) - f (v_{i})

$(\nabla \mathbf{f})(e_{ij}) = f(v_j)-f(v_i)$

这映射在边缘上，并且 $L = D - A$ ，只是 $\nabla ^T \nabla$ , 将通过再次映射每个节点来映射到图上：

(L f) (v_{i}) = \sum_{v_{j} \sim v_{i}} w_{i j} (f (v_{i}) - f (v_{j}))

$(\mathbf{L}\mathbf{f})(v_i) = \sum_{v_j\sim v_i} w_{ij}\big(f(v_i)-f(v_j)\big)$

我将尝试给出更易于理解的（补充）答案。

谱聚类有两个步骤。首先，您确定特征向量之间的邻域边缘（告诉您两个这样的向量是否相似），产生一个图。

然后你把这张图“嵌入”或“重新排列”在一个 d 维的欧几里得空间中。这种嵌入的每个维度都试图为优化问题提供解决方案。通俗地说，这个优化问题是最小化出现在 0 相对两侧的相邻图节点的数量（受空间填充约束）。因此，每个节点往往会靠近其邻居（由图结构决定），这可能是 K-means 工作的更友好空间。

如果您进行数学运算，事实证明拉普拉斯 L 的特征向量为这个优化问题的“松弛”版本提供了解决方案 - 就是这样。

其它你可能感兴趣的问题