在谱聚类的背景下,亲和矩阵特征向量和图拉普拉斯特征向量有什么区别?

数据挖掘 机器学习 聚类 图表
2021-09-30 12:34:34

在谱聚类中,解决特征向量问题是标准做法

大号v=λv

在哪里 大号 是图拉普拉斯算子, v 是与特征值相关的特征向量 λ.

我的问题:为什么要使用图拉普拉斯算子?我不能像这个视频中的那个人那样解决图(亲和矩阵)本身的特征向量问题吗?

PS:我在 CrossValidated 中提出了同样的问题,但我认为这是一个更合适的渠道。如果我错了,请原谅我。

1个回答

概念是相同的,但您对数据类型感到困惑。Ng 等人的光谱聚类。解释是关于聚类标准数据,而拉普拉斯矩阵是代数图论中使用的图派生矩阵。

所以重点是,每当您将对象的相似性编码为矩阵时,该矩阵都可以用于谱聚类。

如果您有标准数据,即样本特征矩阵,您可以找到接近度或亲和度或任何您想将其称为矩阵的数据并应用光谱聚类。

如果你有一个图,这种亲和性可以是邻接矩阵、距离矩阵或拉普拉斯矩阵之类的任何东西,求解这种矩阵的特征函数会给你相应的结果。

使用拉普拉斯矩阵而不是邻接矩阵的要点是保持所谓的亲和矩阵半正定(归一化拉普拉斯矩阵是更好的选择,因为它可以为您提供 0 到 2 之间的归一化特征值并更好地揭示图的结构)。

所以长话短说,只要你有一个包含数据亲和力的矩阵,你就可以使用谱聚类。区别在于细节(我刚才提到的归一化拉普拉斯算子的性质)