我使用了 K 表示聚类。为了找到 K 的最佳值,我查看了惯性值与 K 的变化以及平均轮廓数与 K 的变化。惯性图似乎表明数据中有 5 个集群。然而,平均剪影数达到 5 的最小值。那么,如何解释这一点?如果数据中有 5 个聚类,平均剪影数不应该最大为 5(不是最小值)吗?
谢谢
我使用了 K 表示聚类。为了找到 K 的最佳值,我查看了惯性值与 K 的变化以及平均轮廓数与 K 的变化。惯性图似乎表明数据中有 5 个集群。然而,平均剪影数达到 5 的最小值。那么,如何解释这一点?如果数据中有 5 个聚类,平均剪影数不应该最大为 5(不是最小值)吗?
谢谢
这些只是启发式方法。
这些不是非常可靠的指标,并且经常失败。他们不会检测到您是否没有很好地预处理数据。
因此,与其查看某个数字,不如查看您的数据。