聚类邻接矩阵的最佳方法

机器算法验证 聚类 神经影像学
2022-03-10 02:38:07

我很难解释邻接矩阵的结果簇。我有 200 个相对较大的矩阵,代表包含时间序列(神经数据)的偏相关(z 分数)的主题。目标是对这 210 个矩阵进行聚类并检测任何潜在的未发现社区。所以我做了另一个偏相关计算,得到了 200x200 的邻接矩阵。每当我运行社区检测算法(例如 Newmann's)时,它都会出现难以解释的社区。

问题是,什么样的统计测试可以判断这些社区或集群是否重要?如果是这样,是否有系统的方法来进行解释?

3个回答

我过去在光谱聚类方面做过一些工作,这可能在这里有用。基本思想是可以使用邻接矩阵来形成所谓的拉普拉斯矩阵:

L=ID1/2AD1/2

您可以自己检查拉普拉斯算子的最低特征值是否为零。第一个非零特征值通常称为代数连通性,对应的特征向量将有正负部分对应两个分区(B1,B2)的基础图。粗略地说,第一个非零特征值的大小是两个分区之间连接强度的度量。也许您可以递归地使用这种方法,或者考虑拉普拉斯算子的前几个非零特征值。以下关于谱聚类的维基百科文章是一个好的开始。

我现在正在研究同样的问题。从快速回顾来看,光谱聚类似乎是分析邻接矩阵的最“自然”的方式。有关更多详细信息,请参阅此博客文章

或者......神经数据(真实或人造)通常是数据的高度压缩表示,这意味着数据非常随机,这意味着您不会找到任何相关性。你有哪个!!恭喜!:)