如何比较两个 Pearson 相关性的强度?

机器算法验证 相关性 皮尔逊-r 方法比较
2022-03-23 02:11:43

一位审稿人问我是否可以将表格中显示的 Pearson 相关性(r 值)相互比较,以便可以声称一个比另一个“更强”(而不是仅仅关注实际的 r 值) .

你会怎么做?我找到了这个方法

http://vassarstats.net/rdiff.html

但我不确定这是否适用。

1个回答

(我假设您说的是从样本中获得的r 。)

该网站上的测试适用于它将r视为任何参数,其值在两个群体之间可能不同。r与任何其他度量有什么不同,例如平均值,您非常有信心使用t检验进行比较?嗯,它的不同之处在于它在-1,1 之间绑定,它没有正确的分布,所以你需要在进行推理之前对其进行Fisher 变换(如果你想获得CI,则在之后对其进行变换)。测试得出的 z 分数确实具有可以进行推断的适当形式。这就是您链接到的测试正在做的事情。

所以你链接到的是一个推断如果你能得到你抽样的全部人口的r可能会发生什么的程序 - 一个组的r是否会高于另一组,或者会它们完全一样吗?让我们将其称为后面的假设 H如果测试返回的p值较低,这意味着根据您的样本,您应该对两个r之间差异的真实值恰好为 0 的假设几乎没有信心(因为这样的数据很少出现,如果r的差值正好为 0)。如果不是,您没有数据可以自信地拒绝这个精确相等的假设0r,因为它是真的和/或因为您的样本不足。请注意,我本可以对均值差异(使用t检验)或任何其他度量值进行相同的描述。

一个完全不同的问题是两者之间的差异是否有意义可悲的是,对此没有直接的答案,也没有统计测试可以给你答案。也许r的真实值(总体值,而不是您观察到的值)在一个组中是 0.5,在另一组中是 0.47。在这种情况下,它们等价的统计假设(我们的 H)将是错误的。但这是一个有意义的区别吗?这取决于 - 大约 3% 的解释方差是有意义的还是无意义的?Cohen 给出了解释r的粗略指导方针(并且大概是r之间的差异)0's),但只是在这些只是一个起点的建议下才这样做。而且您甚至不知道确切的差异,即使您进行了一些推断,例如通过计算两个相关之间差异的 CI。很可能,一系列可能的差异将与您的数据兼容。

一个相对安全的赌注是计算您的r的置信区间,并可能计算它们的差异的 CI,并让读者决定。