推荐书籍或文章作为聚类分析的介绍?

机器算法验证 机器学习 参考 聚类
2022-03-24 03:42:02

我正在处理一个小的(200M)文本语料库,我想通过一些聚类分析来探索它。您会推荐哪些关于该主题的书籍或文章?

4个回答

MW Berry 的书可能值得一看:

  1. 文本挖掘调查 I:聚类、分类和检索(2003 年)
  2. 文本挖掘调查 II:聚类、分类和检索(2008)

它们由一系列应用和评论论文组成。最新版本似乎以 PDF 格式在以下地址提供:http: //bit.ly/deNeiy

以下是一些与应用于文本挖掘的 CA 相关的链接:

您还可以查看潜在语义分析,但请查看我的回复:解决聚类问题

在数据中查找组。Leonard Kaufman 和 Peter J. Rousseeuw 教授对聚类分析的介绍。

我正在阅读这本书并发现它非常有用,因为:

  • 正如作者在前言中所说:

我们的目的是为普通用户写一本应用书籍。我们希望为不一定具有强大数学或统计背景的人提供聚类分析。

  • 它提供了理论内容来理解RCluster中可用的功能。

  • 章节可以根据感兴趣的集群方法单独阅读。
    例外是第 3 章,它建立在第 2 章之上

本书的章节如下:

  1. 介绍
  2. 围绕 Medoids 进行分区(程序 PAM)。
  3. 集群大型应用程序(程序 CLARA)。
  4. 模糊分析(程序有趣)。
  5. 凝聚嵌套(程序 AGNES)。
  6. 分裂分析(程序 DIANA)。
  7. 单论分析(程序 MONA)。

参考:

Kaufman, L. 和 Rousseeuw, PJ (2005)。在数据中查找组。聚类分析简介(第 342 页)。约翰威利父子公司

Maechler, M. (2013)。聚类分析扩展 Rousseeuw 等人。克兰。

数据挖掘简介的这一章可在线获得,并提供了很好的概述。

Brian S. Everitt 的聚类分析是一本很好的书本长度应用聚类分析方法。