一位审稿人问我是否可以将表格中显示的 Pearson 相关性(r 值)相互比较,以便可以声称一个比另一个“更强”(而不是仅仅关注实际的 r 值) .
你会怎么做?我找到了这个方法
http://vassarstats.net/rdiff.html
但我不确定这是否适用。
一位审稿人问我是否可以将表格中显示的 Pearson 相关性(r 值)相互比较,以便可以声称一个比另一个“更强”(而不是仅仅关注实际的 r 值) .
你会怎么做?我找到了这个方法
http://vassarstats.net/rdiff.html
但我不确定这是否适用。
(我假设您说的是从样本中获得的r 。)
该网站上的测试适用于它将r视为任何参数,其值在两个群体之间可能不同。r与任何其他度量有什么不同,例如平均值,您非常有信心使用t检验进行比较?嗯,它的不同之处在于它在-1,1 之间绑定,它没有正确的分布,所以你需要在进行推理之前对其进行Fisher 变换(如果你想获得CI,则在之后对其进行变换)。测试得出的 z 分数确实具有可以进行推断的适当形式。这就是您链接到的测试正在做的事情。
所以你链接到的是一个推断如果你能得到你抽样的全部人口的r可能会发生什么的程序 - 一个组的r是否会高于另一组,或者会它们完全一样吗?让我们将其称为后面的假设 H。如果测试返回的p值较低,这意味着根据您的样本,您应该对两个r之间差异的真实值恰好为 0 的假设几乎没有信心(因为这样的数据很少出现,如果r的差值正好为 0)。如果不是,您没有数据可以自信地拒绝这个精确相等的假设r,因为它是真的和/或因为您的样本不足。请注意,我本可以对均值差异(使用t检验)或任何其他度量值进行相同的描述。
一个完全不同的问题是两者之间的差异是否有意义。可悲的是,对此没有直接的答案,也没有统计测试可以给你答案。也许r的真实值(总体值,而不是您观察到的值)在一个组中是 0.5,在另一组中是 0.47。在这种情况下,它们等价的统计假设(我们的 H)将是错误的。但这是一个有意义的区别吗?这取决于 - 大约 3% 的解释方差是有意义的还是无意义的?Cohen 给出了解释r的粗略指导方针(并且大概是r之间的差异)'s),但只是在这些只是一个起点的建议下才这样做。而且您甚至不知道确切的差异,即使您进行了一些推断,例如通过计算两个相关之间差异的 CI。很可能,一系列可能的差异将与您的数据兼容。
一个相对安全的赌注是计算您的r的置信区间,并可能计算它们的差异的 CI,并让读者决定。