高维数据的聚类

数据挖掘 机器学习 r 数据挖掘 聚类 无监督学习
2021-09-30 07:28:15

我有一个包含 52 个变量的数据集。它们中的大多数都有零,它类似于一个稀疏矩阵。如何对此类数据进行聚类,是否有任何特殊类型的聚类?我正在附上 pca 图

在此处输入图像描述

1个回答

它不需要任何特殊方法。选择的算法取决于您的数据,例如欧几里得距离是否适用于您的数据。

一般来说,您可以在您的 X 或 PCA 上尝试 Kmeans 或其他方法;但是层次聚类可能是可视化高维数据的聚类的不错选择。

在此处输入图像描述

如果您可以读/写 python 代码,在此处查看。