当 Eigengap 启发式建议 1 进行谱聚类时,如何选择聚类数?

数据挖掘 聚类
2022-01-27 15:44:11

特征值启发式方法建议聚类数 k 通常由最大化特征值(连续特征值之间的差异)的 k 值给出。我为我的数据绘制了特征值分布:[排名特征值]

Eigengap 启发式会建议簇数: 1. 在这种情况下我应该如何选择簇数?

1个回答

图中的第一个特征值非零,而最后一个特征值是一个。

这似乎表明您正在计算其特征值的拉普拉斯算子与标准拉普拉斯算子不同L=DW, 在哪里D是矩阵,其对角元素是节点的度数,并且W是加权邻接矩阵。所以在你的情节中,λ19=1λ181但是1 这表明该图是一个连通分量。

所以解释你的情节的正确方法是反转它(λ1λ) 然后按升序排列,或按原样按降序排列。

然后你可以使用 eiengap heuristic 为集群的数量选择一个合适的值(7 似乎是一个不错的选择,因为λ13λ12比较大λ14λ13,或者如果集群的数量是一个约束,则可能是 3)。

这在 Luxborg 的 Spectral Clustering 优秀教程中有更详细的描述,您可以在 Ng等人的开创性论文中找到脚注