关于 K 的轮廓数的问题均值聚类

数据挖掘 聚类 scikit-学习
2022-03-01 10:04:42

我使用了 K 表示聚类。为了找到 K 的最佳值,我查看了惯性值与 K 的变化以及平均轮廓数与 K 的变化。惯性图似乎表明数据中有 5 个集群。然而,平均剪影数达到 5 的最小值。那么,如何解释这一点?如果数据中有 5 个聚类,平均剪影数不应该最大为 5(不是最小值)吗?

谢谢

1个回答

这些只是启发式方法

这些不是非常可靠的指标,并且经常失败。他们不会检测到您是否没有很好地预处理数据。

因此,与其查看某个数字,不如查看您的数据。