数据挖掘 - 当 Eigengap 启发式建议 1 进行谱聚类时，如何选择聚类数？ - 吾爱随笔录

当 Eigengap 启发式建议 1 进行谱聚类时，如何选择聚类数？

数据挖掘聚类

2022-01-27 15:44:11

特征值启发式方法建议聚类数 k 通常由最大化特征值（连续特征值之间的差异）的 k 值给出。我为我的数据绘制了特征值分布：[ 排名特征值]

Eigengap 启发式会建议簇数： 1. 在这种情况下我应该如何选择簇数？

1个回答

图中的第一个特征值非零，而最后一个特征值是一个。

这似乎表明您正在计算其特征值的拉普拉斯算子与标准拉普拉斯算子不同 $L = D - W$ ，在哪里 $D$ 是矩阵，其对角元素是节点的度数，并且 $W$ 是加权邻接矩阵。所以在你的情节中， $\lambda_{19} = 1$ 和 $\lambda_{18} \neq 1$ 但是 $\approx 1$ 这表明该图是一个连通分量。

所以解释你的情节的正确方法是反转它（ $\lambda \mapsto 1 - \lambda$ ) 然后按升序排列，或按原样按降序排列。

然后你可以使用 eiengap heuristic 为集群的数量选择一个合适的值（7 似乎是一个不错的选择，因为 $\lambda_{13}-\lambda_{12}$ 比较大 $\lambda_{14}-\lambda_{13}$ ，或者如果集群的数量是一个约束，则可能是 3）。

这在 Luxborg 的 Spectral Clustering 优秀教程中有更详细的描述，您可以在 Ng等人的开创性论文中找到脚注。

其它你可能感兴趣的问题

上一篇自动编码器设置中解码器的输入到底是什么下一篇StanfordTokenizer 将在 3.2.5 版本中被弃用