机器算法验证 - 如何比较两个 Pearson 相关性的强度？ - 吾爱随笔录

如何比较两个 Pearson 相关性的强度？

机器算法验证相关性皮尔逊-r 方法比较

2022-03-23 02:11:43

一位审稿人问我是否可以将表格中显示的 Pearson 相关性（r 值）相互比较，以便可以声称一个比另一个“更强”（而不是仅仅关注实际的 r 值） .

你会怎么做？我找到了这个方法

http://vassarstats.net/rdiff.html

但我不确定这是否适用。

1个回答

（我假设您说的是从样本中获得的r 。）

该网站上的测试适用于它将r视为任何参数，其值在两个群体之间可能不同。r与任何其他度量有什么不同，例如平均值，您非常有信心使用t检验进行比较？嗯，它的不同之处在于它在-1,1 之间绑定，它没有正确的分布，所以你需要在进行推理之前对其进行Fisher 变换（如果你想获得CI，则在之后对其进行变换）。测试得出的 z 分数确实具有可以进行推断的适当形式。这就是您链接到的测试正在做的事情。

所以你链接到的是一个推断如果你能得到你抽样的全部人口的r可能会发生什么的程序 - 一个组的r是否会高于另一组，或者会它们完全一样吗？让我们将其称为后面的假设 H。如果测试返回的p值较低，这意味着根据您的样本，您应该对两个r之间差异的真实值恰好为 0 的假设几乎没有信心（因为这样的数据很少出现，如果r的差值正好为 0)。如果不是，您没有数据可以自信地拒绝这个精确相等的假设 $_0$ r，因为它是真的和/或因为您的样本不足。请注意，我本可以对均值差异（使用t检验）或任何其他度量值进行相同的描述。

一个完全不同的问题是两者之间的差异是否有意义。可悲的是，对此没有直接的答案，也没有统计测试可以给你答案。也许r的真实值（总体值，而不是您观察到的值）在一个组中是 0.5，在另一组中是 0.47。在这种情况下，它们等价的统计假设（我们的 H）将是错误的。但这是一个有意义的区别吗？这取决于 - 大约 3% 的解释方差是有意义的还是无意义的？Cohen 给出了解释r的粗略指导方针（并且大概是r之间的差异） $_0$ 's)，但只是在这些只是一个起点的建议下才这样做。而且您甚至不知道确切的差异，即使您进行了一些推断，例如通过计算两个相关之间差异的 CI。很可能，一系列可能的差异将与您的数据兼容。

一个相对安全的赌注是计算您的r的置信区间，并可能计算它们的差异的 CI，并让读者决定。

其它你可能感兴趣的问题

上一篇帽子矩阵的重要性是什么，H= X(X⊤X)− 1X⊤H=X(X⊤X)−1X⊤，在线性回归中？下一篇大数据假设检验