如何以很好的方式绘制集群?

数据挖掘 聚类 文本挖掘 绘图 matplotlib
2021-09-30 14:36:30

我有一个大型文本数据集聚类。每个集群由属于它的矢量化文本的质心、文本数量、创建日期和其他参数表示。我无法在 n 维空间中绘制集群。我有哪些选择?

3个回答

T-SNE是另一个答案文章中没有提到的另一种降维算法。如果您已经为数据集训练了一些嵌入,则用于非常高维的数据。参考这里Python 标准库在这里

干杯

几个选项:

还有更多...

您可以使用降维算法(如主成分分析)将数据的维数减少到 2 或 3,然后使用降维变量执行散点图,根据它们所属的集群对它们进行着色。这篇博文中,也做了类似的事情。