自组织地图在当今科学中的相关性如何?

数据挖掘 机器学习 神经网络 聚类
2021-10-07 03:25:20

自组织地图是一种非常智能且快速且简单的数据聚类方法。但是自组织地图是在 1990 年开发的,从那时起,已经开发了许多使用降维方法的鲁棒和强大的聚类方法。它在当今的科学和工程领域有哪些应用?

2个回答

今天,SOM 的一个重要且众所周知的(在他们各自的研究领域中)使用是使用 SOM 进行数据可视化和聚类。

U-Matrix 使用具有大量神经元的 SOM 来实现紧急行为。基于 SOM,为每个神经元计算所谓的 U 高度。

对于一个神经元 n, 一个权重 wn 神经元的 n, 以及一组 ññ(n) 的直接邻居 n U 高度计算如下:

ññ(n)d(wn-w)

d与 SOM 训练中使用的距离相同。这个 U 高度用于可视化 SOM,并且能够捕捉到非常有趣的固有结构。它通过使用类似于地形图的配色方案进行可视化:

U-矩阵

U-Matrix 使用距离进行可视化。它可以与使用密度的所谓 P-Matrix 结合使用数据点的密度,并允许密度和距离的组合。基于 U-Matrix 也可以进行分类或聚类。一个 R 包由 Ultsch 教授的研究小组分发。

我不会说它在机器学习本身中很重要,但在数据挖掘和 KDD 领域它是重要的,至少在学术上是这样。如果您在语义学者或研究门上查看此或类似工作的接收情况,您可以清楚地看到这一点。

免责声明:我师从 U-Matrix 和 U*-Matrix 的负责人 Ultsch 教授。

注意:很抱歉缺少论文链接,我还没有足够的声誉发布两个以上的链接。

文件:

  • U*-matrix:在高维数据中可视化集群的工具,Ultsch 2004
  • 用于可视化和分类的自组织神经网络,Ultsch 1993

我什至在这里发现了野外的 U-Matrix 另请参阅 sompy 包。

举个实际的例子,还是挺相关的。

流式细胞术领域,最近(2015 年)的聚类算法FlowSom利用了自组织图。

甚至在最近(2016 年,参见此处),它已被证明是流式细胞术和质谱流式细胞术领域中表现最好的聚类算法之一。