应用和可视化 k 意味着对具有 9 个特征的数据集进行聚类

数据挖掘 scikit-学习 聚类 k-均值 无监督学习
2022-02-16 14:17:50

我有一个图像数据集,我提取了 9 个数字特征,我想应用 k 均值聚类或层次聚类。我只是不知道该怎么做。我读过的教程都只有 2 或 3 个特性,因此很容易应用和绘制图表。任何帮助,将不胜感激

这是我到目前为止的代码:

numpyArr = df.values


ms = MeanShift()
ms.fit(numpyArr)
labels = ms.labels_
cluster_centers = ms.cluster_centers_
n_clusters_ = len(np.unique(labels))
print("Number of estimated clusters:", n_clusters_)
3个回答

您可以在执行聚类后使用 PCA 方法等降维算法,将聚类数据的维度减少为二维,然后可视化集群。

与可视化 9 维数据相同:

  • 带有 9x9 散点图的散点图矩阵
  • 降维
  • 平行坐标
  • 晶须图
  • ...

如果您想在 K-Means 之后可视化数据,更好的方法是将维度减少到二维或三维,并使用 matplotlib 2D 或 3D 图进行可视化。您也可以尝试配对图,但我认为从聚类的角度来看这不会有太大帮助。