如何从书目中开始分析关键字并检测相关性?
机器算法验证
r
文本挖掘
2022-03-13 02:46:50
4个回答
所以你有一个文档 x 关键字矩阵,它基本上代表一个二分图(或取决于你的文化背景的双模式网络),文档和标签之间有边。如果您对单个文档不感兴趣(据我了解),您可以通过计算每个关键字之间的共现次数来创建关键字网络。简单地绘制此图可能已经让您对这些数据的外观有了一个清晰的了解。如果您可以进一步调整可视化,例如,通过总出现次数来缩放关键字的大小,或者(如果您有很多关键字)为关键字在第一次出现时引入最小总出现次数地方。
作为一种工具,我只能推荐GraphViz,它允许您指定图形,例如
keyword1 -- keyword2
keyword1 -- keyword3
keyword1[label="statistics", fontsize=...]
并将它们“编译”成 png、pdf 等等,产生非常好的结果(特别是如果你稍微使用字体设置)。
其它你可能感兴趣的问题