Pearson 与具有不同尺度值的数据集的相关性

数据挖掘 相关性 相似 皮尔逊相关系数
2021-10-16 05:14:54

我有两个数据集,我想对其进行 Pearson 相关分析。我已经进行了有意义的分析,但是我想确保它是有效的,因为这两个数据集都有不同尺度的值。

两个数据集中的特征完全相同(实际样本当然不同)。取值范围如下:

dataset1 = 3-20
dataset2 = 10-30

现在我的理解是,皮尔逊相关系数不依赖于不同数据集规模的变化或差异,但是对于我所看到的所有示例,虽然规模不同,但较低的值始终为 0。如您所见,一个数据集的下限值是 3,另一个数据集的下限值是 10。(在任何一种情况下,尽管它们意味着它们的“低”水平相同,但这就是它们的测量方式。

任何人都可以确认这仍然可以吗?

1个回答

对于定量-定量比较,尺度通常与 spearmean、pearson 和 kendall 相关无关。