我想知道你们是否有一些关于主题模型和 LDA 的很好的教程(快速而直接),直观地教授如何设置一些参数,它们的含义,如果可能的话,还有一些真实的例子。
主题模型和 LDA 教程
数据挖掘
主题模型
低密度脂蛋白
2021-09-18 07:58:16
4个回答
如果您使用 R,Carson Sievert 的关于使用 LDA 对电影评论中的主题建模的教程是一个很好的起点:
http://cpsievert.github.io/LDAvis/reviews/reviews.html
本教程使用 LDAvis,这是一种可以真正帮助直觉的主题和单词分布的交互式可视化。
此外,虽然不短,但 David M. Blei 关于主题模型的讲座对于理解参数背后的含义是一个很好的资源:http: //videolectures.net/mlss09uk_blei_tm/
我强烈推荐本教程:主题建模和 MALLET 入门
这里有一些额外的链接可以帮助您开始...
好的介绍材料(包括研究论文的链接):http ://www.cs.princeton.edu/~blei/topicmodeling.html
软件:
- 木槌(Java): http: //mallet.cs.umass.edu/topics.php
- 主题建模开发者指南: http: //mallet.cs.umass.edu/topics-devel.php
- gensim(Python):http ://radimrehurek.com/gensim/
- 主题模型(R):http ://cran.r-project.org/web/packages/topicmodels/index.html
- 斯坦福主题建模工具箱(专为社会科学家设计):http ://www-nlp.stanford.edu/software/tmt/tmt-0.4/
- Mr.LDA(使用 MapReduce 的可扩展主题建模):http ://lintool.github.io/Mr.LDA/
- 如果您正在处理大量输入文本,您可能需要考虑使用 Mr.LDA 来构建您的主题模型——其基于 MapReduce 的方法在处理大量数据时可能更有效。
更多信息请参见 Biased Estimates 博客:主题模型阅读列表
如果您正在寻找一些简单的开始和易于实施的东西,我会推荐这个。
CLARIN-D 项目在Universität des Saarlandes CLARIN 中心主办的教学和学习材料合集 (TeLeMaCo)网站上收集了一些关于主题建模和 LDA 教程的良好指南。
其它你可能感兴趣的问题