我正在尝试追查“集群”一词的起源及其在集群分析上下文中的用法。
请问,有谁知道它是什么时候和谁第一次使用的?也许有一篇论文或一本书创造了这些术语?
或者,也许有一些文献描述了与“集群”一词一起使用的领域的开端,例如机器学习或某种统计?
我正在尝试追查“集群”一词的起源及其在集群分析上下文中的用法。
请问,有谁知道它是什么时候和谁第一次使用的?也许有一篇论文或一本书创造了这些术语?
或者,也许有一些文献描述了与“集群”一词一起使用的领域的开端,例如机器学习或某种统计?
“岩石群”、“岛屿群”、“工厂群”等可以很容易地追溯到 19 世纪(而且可能更久)。当然,统计数据很早就开始寻找一种将其形式化的方法。祝你好运,你可能需要去很多图书馆(物理图书馆,而不是软件图书馆)!
不要看“机器学习”。ML 没有发明聚类分析;大多数聚类分析研究都发生在 ML 社区之外。
“聚类分析”一词可以追溯到 1930 年代的统计数据;但是您可以想象,上述概念中的“集群”使用得更早——但集群分析试图准确地发现“集群”的这个概念。许多早期的用途是对自然界中的聚类观察,例如物种;通过位置或相似性。不涉及计算机:可能直到 1957 年才出现第一个“聚类分析”算法(在此之前,聚类分析是“笔和纸”)
PH Sneath:计算机在分类学中的应用。在:普通微生物学杂志。17(1), 1957, S. 201–226。
根据牛津词典,cluster一词源自古英语单词'clyster',“可能与clot [或clott]有关”,源自日耳曼语'klotz'。