如何生成用户友好的聚类分析摘要?

机器算法验证 数据可视化 聚类 教学
2022-04-12 06:59:01

我使用BIRCHHAC对我的数据进行聚类。

我现在想知道我可以在我的用户生成的报告中包含哪些类型的信息,以获得对集群的更多见解。我将不得不简化统计术语,并在这些报告中为我的用户尽可能直观地表示它们。

3个回答

我喜欢显示集群和实际数据点的 2D 图,以便读者了解集群的质量。如果有两个以上的因素,您可以将主成分放在轴上,如我的示例所示:

JMP K-Means 2D 聚类报告

等效的 3D 绘图只有在观看者可以与之交互时才能获得深度感和模糊的部分。这是具有相同数据的 3D 示例。

JMP K-Means 3D 聚类报告

我为非技术人员找到的最佳方法是展示每个集群的质心表格或图表以及该集群的描述。它有助于商业世界(不确定您的领域)为每个集群命名,描述其主要特征。集群客户的示例是:通常由长期客户组成的集群的“长期忠诚者”。

气泡图是一种很好的可视化设备,您可以使用它来表示您的集群。选择 4 个最重要的变量,并使用 x 和 y 轴、气泡的大小和颜色绘制每个集群以表示 4 个因素。如果您有许多变量,您可以先执行主成分分析,以将它们减少到 4 个因素。

http://www.google.com/images?um=1&hl=en&rlz=1I7GGLD_en&tbs=isch:1&aq=f&aqi=g6&oq=&q=bubble%20chart

——拉尔夫·温特斯