数据挖掘 - 聚类谱 - 吾爱随笔录

我有熊猫表，其中包含有关不同观察的数据，每一个都是以不同的波长测量的。这些观察结果在他们得到的治疗方面彼此不同。该表如下所示：

>>>name  treatment 410.1 423.2 445.6 477.1 485.2 ....
0 A1       0       0.01  0.02  0.04  0.05   0.87
1 A2       1       0.04  0.05  0.05  0.06  0.04
2 A3       2       0.03  0.02  0.03 0.01   0.03
3 A4       0       0.02  0.02  0.04  0.05  0.91
4 A5       1       0.05  0.06  0.04  0.05  0.02
...

我想根据光谱（数值列）对不同的观察结果进行分类。
我尝试运行 PCA 并根据观察得到的处理对其进行绘制，并将其与 k-means 和光谱聚类等分类结果进行比较，但我不确定我是否选择了正确的方法，因为似乎一直以来，就像集群太像欧几里得距离，我不确定它们是否考虑了光谱（我已经使用了所有的数值列进行预测）。

例如，PCA+颜色与光谱分类的比较：
PCA：

分类（根据PCA1 PCA2定位但颜色根据分类：

正如您在此处看到的，分类似乎是基于实际距离，我想要一些考虑到所有数值的东西。

所以，我正在寻找关于其他分类方法的任何见解，这些方法可以给我更好的结果，或者其他想法，我如何根据不同列中的测量值检查我的数据中是否存在集群，比如我是否可以预测治疗从集群