我正在处理一个小的(200M)文本语料库,我想通过一些聚类分析来探索它。您会推荐哪些关于该主题的书籍或文章?
推荐书籍或文章作为聚类分析的介绍?
机器算法验证
机器学习
参考
聚类
2022-03-24 03:42:02
4个回答
MW Berry 的书可能值得一看:
- 文本挖掘调查 I:聚类、分类和检索(2003 年)
- 文本挖掘调查 II:聚类、分类和检索(2008)
它们由一系列应用和评论论文组成。最新版本似乎以 PDF 格式在以下地址提供:http: //bit.ly/deNeiy。
以下是一些与应用于文本挖掘的 CA 相关的链接:
您还可以查看潜在语义分析,但请查看我的回复:解决聚类问题。
在数据中查找组。Leonard Kaufman 和 Peter J. Rousseeuw 教授对聚类分析的介绍。
我正在阅读这本书并发现它非常有用,因为:
- 正如作者在前言中所说:
我们的目的是为普通用户写一本应用书籍。我们希望为不一定具有强大数学或统计背景的人提供聚类分析。
它提供了理论内容来理解
R
包Cluster中可用的功能。章节可以根据感兴趣的集群方法单独阅读。
例外是第 3 章,它建立在第 2 章之上
本书的章节如下:
- 介绍
- 围绕 Medoids 进行分区(程序 PAM)。
- 集群大型应用程序(程序 CLARA)。
- 模糊分析(程序有趣)。
- 凝聚嵌套(程序 AGNES)。
- 分裂分析(程序 DIANA)。
- 单论分析(程序 MONA)。
参考:
Kaufman, L. 和 Rousseeuw, PJ (2005)。在数据中查找组。聚类分析简介(第 342 页)。约翰威利父子公司
Maechler, M. (2013)。聚类分析扩展 Rousseeuw 等人。克兰。
数据挖掘简介的这一章可在线获得,并提供了很好的概述。
Brian S. Everitt 的聚类分析是一本很好的书本长度应用聚类分析方法。
其它你可能感兴趣的问题