Pearson 的 r ~= 0 和 p > 0.05 之间的差异

机器算法验证 皮尔逊-r
2022-04-11 20:56:07

统计数据是我的弱点,所以细节对我了解正在发生的事情很重要。我正在阅读这个关于统计的介绍性网站,他们说了以下内容(强调我的)。

当 Pearson 的 r 接近 0 时……这意味着您的两个变量之间的关系较弱。这意味着一个变量的变化与第二个变量的变化不相关。 如果我们的 Pearson 的 r 为 0.01,我们可以得出结论,我们的变量不是强相关的。

这是否意味着即使您的 2 尾 p 值 < 0.05,接近零的值r意味着没有相关性?

所以总结一下:如果 p < 0.05 OR r ~= 0,没有相关性?那是对的吗?

2个回答

p 值和皮尔逊相关系数衡量不同的事物。r

r衡量相关性的强度。另一方面,p 值衡量您在原假设下观察到这种强度的相关性的可能性 - 例如,在您的随机变量不相关的假设下。

直观地说,您观察到的相关性越强,它由两个不相关的变量偶然发生的可能性就越小。但是,即使您观察到非常弱的相关性,您也可能会获得与此观察相关的非常低的 p 值 - 例如,当您的样本量趋于无穷大时,即使您观察到的相关性非常低,您也会得到非常低的 p 值虚弱的。

所以回答你的问题:接近 0 且 p 值 < 0.05 意味着存在相关性,但它非常弱。r

我赞成 rinspy 的答案。在这里,我将尝试添加一些内容。

~ ~ ~

rp值衡量不同的事物。

p值表示在假设原假设为真的情况下,获得与观察到的数据一样极端的数据的概率根据我们的决策规则,如果p < alpha,我们有足够的证据来拒绝没有相关性的原假设。这就是p值对我们所做的一切。

p值结果的信息量通常比我们想象的要少得多。得出具有统计显着相关性的结论并不能告诉我们相关性有多强,当然也不能告诉我们相关性是否具有实际重要性。

r是效应大小的量度。它告诉我们相关性有多强。

效应量的解释必然取决于学科和分析的期望。在物理学或化学中,可能会出现近乎完美的关系,而在宏观生物学或心理学中,可能会注意到更小的影响大小。Cohen (1988) 给出了一些行为科学指南: 小,≥ 0.10;中等,≥0.30;大 ≥ 0.50。

~ ~ ~

效应大小不受样本大小的影响,而p值将受给定效应大小的样本大小影响。

考虑x = (1, 2, 3),y = (1, 1, 2)。这里,r = 0.866;p = 0.33。

现在,我们将保持相同的值,但将xy的观察次数加倍。效果大小保持完全相同。但是现在,有了 6 个观测值,并且r为 0.866,p值降至 0.05 以下。

x = (1, 2, 3, 1, 2, 3),y = (1, 1, 2, 1, 1, 2)。 r = 0.866; p = 0.03。

我们将再次增加样本量。

x = (1, 2, 3, 1, 2, 3, 1, 2, 3),y = (1, 1, 2, 1, 1, 2, 1, 1, 2)。 r = 0.866; p = 0.003。

对于小样本,效应量可能不是很丰富。例如,如果我们测量两个人的身高和体重,我们会发现身高和体重完全相关,并且r = 1。这不会给我们留下深刻印象。如果我们将样本量增加到三或四个,我们仍然可能会发现一个较大的r值,但要知道这很可能是偶然的。在这里,我们可能更多地依赖p值来确定是否发生了有趣的事情。

对于较大的样本量,即使r很小, p值也可能很重要。在这里,我们要确保查看效果大小r ,并且不要对p赋予过多的权重。

~ ~ ~

r可能并不总是了解相关性大小的最佳方式。例如,如果我告诉你玉米产量和施肥量之间的相关性,“ p = 0.01; r = 0.4” 可能是有意义的。但您可能想知道类似“每增加 5 公斤肥料,玉米产量增加 1000 公斤/公顷。


† 在这种情况下,“极端”意味着相关。

参考 Cohen, J. 1988。行为科学的统计功效分析,第 2 版。劳特利奇。