关于树状图聚类的共生相关

机器算法验证 聚类 分类
2022-03-16 00:22:34

考虑树状图聚类的上下文。让我们将原始差异称为个体之间的距离。在构建树状图之后,我们将两个个体之间的共同差异定义为这些个体所属的集群之间的距离。

有些人认为原始相异与共相相异之间的相关性(称为共相相关性)是分类的“适用性指标”。这对我来说听起来完全令人费解。我的反对并不依赖于 Pearson 相关性的特定选择,而是依赖于原始差异和共同差异之间的任何联系都可能与分类的适用性有关的一般想法。

你同意我的观点吗,或者你能提出一些支持使用共生相关性作为树状图分类的适用性指标的论据吗?

1个回答

...是分类的“适用性指标”

对我来说,不清楚这是什么意思。我得到它的方式是这样的

原始相异与共相相异之间的相关性(称为共相相关性)

是观测之间的层次结构的度量,即它们的距离。也就是说,不同聚类中的观测值的差异最好是相似的。考虑到数据集 A 和 B 使用欧几里得距离和完全链接进行聚类... 在此处输入图像描述 ...即使没有查看共相距离图或计算共相相关性,也可以看出 A 的共相相关性高于 B . 在层次结构中有层次。因此,CC 会告诉您与同一级别(集群)上的观测值的距离是否相似。

为了完整起见:共生相关是 CC(A) = 0.936 和 CC(B) = 0.691