对此类数据进行聚类的最佳方法是什么?

数据挖掘 聚类 统计数据 描述性统计
2022-03-16 03:36:47

我的数据如下所示: 在此处输入图像描述

左边的图表是趋势,右边较小的图表是显示均值分布的箱线图。每种颜色都是特定工具的输出。我不需要对其进行 ANOVA 和 Tukey 测试,因为很容易看出工具之间存在统计学上的显着差异。但是,我想根据它们的平均值对工具进行分组/聚类。

例如,从视觉上讲,可以将所有工具分成 4 组。4 个工具的平均值约为32, 12 个工具的平均值约为30, 5 个工具的方差相当高,其平均值并不真正属于特定组,其余的平均值约为30

更新:

我使用了 k-means 聚类技术和 Hierarchical Agglomeration 技术。但是,我必须提前指定集群的数量。是否有任何聚类技术我不必先验地指定聚类的数量?

1个回答

在凝聚和分裂的层次聚类中,您不必预先指定聚类的数量。您可以创建所有可能的集群,然后选择最后使用的数字集群。