这是距离矩阵之间的相关性吗?

数据挖掘 相关性
2022-03-16 12:04:31

我有一组对象。我计算了两个距离矩阵:X使用度量定义每个对象对之间的距离f1, 和Y-- 使用公制f2. 现在,我想根据度量了解两个对象是否相似f1, 那么它们在度量上也是相似的f2. 我该怎么做?

例如,f1可以说两个物体是否具有相似的颜色,并且f2--- 两个物体的大小是否相似。但指标可以是任何东西。例如,我们可以谈论文章,f1可能是 Jaccard 距离,测量两篇文章共享多少标签,以及f2可以是欧几里得距离测量两篇文章的词向量之间的距离。现在我想了解两个蓝色物体的物体是否往往很大,或者带有“种族主义”标签的文章是否具有相似的内容。

我在问相关性吗?我如何计算它之间XY?

1个回答

你基本上是对的。您想检查一个变量相对于另一个变量的依赖程度。无论您如何生成每个变量,如果您想知道它与另一个变量的依赖程度,您通常使用相关性来运行该评估。

在分析 X 和 Y 之间的潜在依赖关系时,您应该考虑的非常有用的选项是:

  • 相关性:衡量两个变量之间线性关系的强度和方向。
  • 协方差:评估变量之间线性关系的方向(不是强度)。
  • 皮尔逊相关性:获得表示两个变量之间依赖程度(强度)的单个度量
  • Spearman 相关性:评估两个变量之间潜在的非线性相关性。

有关更多信息,请在此处查看此帖子。