按轮廓排序的每个集群的索引图

机器算法验证 r 数据可视化 聚类 电车
2022-04-14 12:32:01

在集群分析之后,我试图为每个集群绘制轮廓值的索引图,而不是完整的数据集(如 Matthias Studer 的 WeightedCluster Library Manual 中)。首先,这在理论上是否正确?如果是...

我使用 wcSilhouetteObs 命令创建对象“sil”:

sil <- wcSilhouetteObs(distance.matrix, cluster.object)

然后我绘制完整数据集的索引图(这条线有效,即使我无法标记集群,但现在我不在乎):

seqIplot(seq.data, group = group.p(cluster.object), sortv = sil)

但是,当我尝试绘制按我不知道的轮廓排序的索引图时(但正如我所说,我不确定它在理论上是否正确......)如何对仅选择轮廓值,例如第一个集群。我已经为每个集群分别创建了一个序列对象(比如说cluster1.seq),但是我应该怎么做呢?

谢谢!伊曼纽拉

1个回答

为每个观察计算轮廓i作为

s(i)=b(i)a(i)max(a(i),b(i))

其中是与所属集群成员的平均相异度,是与另一个集群成员的最小平均相异度。a(i)ib(i)

成员的轮廓值与簇成员向量中处于相同位置所以你没有什么可做的。您的命令将自动为每个集群生成一个索引图,其中序列按每个集群中的轮廓值排序。kkcluster.objectseqIplot

序列将从低到高的轮廓值自下而上排序,这意味着每个聚类具有最佳轮廓值的序列位于图的顶部。

希望这可以帮助。