我从一个包含许多个体维度的数据集开始(每个 id 是一个单独的个体),并Features/Attributes为每个individual Id.
我的目标是根据这些特征将这些人分成两个或三个不同的组,看看我是否可以识别某些组之间的明显分离。
我想知道是否有人有任何建议或算法(最好是在 Python 中)将这些人聚集到不同的组中?我没有这些Individuals分类,所以这是一个无监督的聚类问题。我在想这K-Means可能是一个不错的选择,或者类似于 PCA 的东西,它可以降低我的维度并提供对似乎将个体群体分成不同群体的特征的洞察力。
感谢您的关注!
注意:下面显示的数据是人为生成的,以说明我的问题。
附录:参考数据:
Pattern,Feature A,Feature B,Feature C
6,2.18,0.13,8.00
9,9.31,3.67,6.58
11,0.89,1.83,4.33
13,9.73,9.50,1.59
23,0.51,6.49,0.09
26,9.04,3.42,3.90
27,8.35,9.18,3.40
28,3.04,5.63,6.88
32,9.78,6.52,8.50
43,4.11,3.36,1.83
49,9.57,1.52,7.09
51,1.13,9.98,9.42
53,6.22,1.37,7.07
62,8.79,3.03,7.52
63,6.27,7.29,0.98
71,4.64,0.06,6.55
73,1.34,9.32,5.15
83,4.53,3.85,2.04
84,9.48,9.71,3.23
86,3.80,3.00,0.76
88,1.73,0.64,9.96
