我正在尝试评估聚类性能。我正在阅读有关metrics的 skiscit-learn 文档。我不明白 ARI 和 AMI 之间的区别。在我看来,他们以两种不同的方式做同样的事情。
从文档中引用:
鉴于基本事实类分配标签_true和我们对相同样本标签_pred的聚类算法分配的知识,调整后的兰德指数是一个衡量两个分配相似性的函数,忽略排列和机会归一化。
对比
鉴于地面实况类分配labels_true和我们对相同样本labels_pred的聚类算法分配的知识,互信息是一个衡量两个分配一致性的函数,忽略排列......AMI是最近提出的,并且针对机会。
我应该在我的聚类评估中同时使用它们还是这会是多余的?