有许多指标可以评估聚类算法,例如 Calinski-Harabaz 指数、Dunn 指数、Rand 指数等。与其他指标相比,使用 Dunn 指数来评估聚类算法(尤其是 K-means)有什么优势吗?如果是,有什么优点和缺点?
与其他指标相比,使用 Dunn 索引来评估聚类算法有什么优势?
数据挖掘
机器学习
分类
聚类
无监督学习
评估
2022-03-11 08:43:55
1个回答
他们通常会给出相同的偏好。
不要忘记,这些主要是启发式的。他们彼此之间不会有太多优势。这就是为什么有这么多。
作为指导,请查看定义。选择与您的问题最相关的指数。(是的,您确实需要了解它们的作用。聚类很难,只看代码和分数而忘记基础数学很容易得到毫无意义的结果。)