我赞成 rinspy 的答案。在这里,我将尝试添加一些内容。
~ ~ ~
r和p值衡量不同的事物。
p值表示在假设原假设为真的情况下,获得与观察到的数据一样极端的数据的概率。根据我们的决策规则,如果p < alpha,我们有足够的证据来拒绝没有相关性的原假设。这就是p值对我们所做的一切。
p值结果的信息量通常比我们想象的要少得多。得出具有统计显着相关性的结论并不能告诉我们相关性有多强,当然也不能告诉我们相关性是否具有实际重要性。
r是效应大小的量度。它告诉我们相关性有多强。
效应量的解释必然取决于学科和分析的期望。在物理学或化学中,可能会出现近乎完美的关系,而在宏观生物学或心理学中,可能会注意到更小的影响大小。Cohen (1988) 给出了一些行为科学指南: 小,≥ 0.10;中等,≥0.30;大 ≥ 0.50。
~ ~ ~
效应大小不受样本大小的影响,而p值将受给定效应大小的样本大小影响。
考虑x = (1, 2, 3),y = (1, 1, 2)。这里,r = 0.866;p = 0.33。
现在,我们将保持相同的值,但将x和y的观察次数加倍。效果大小保持完全相同。但是现在,有了 6 个观测值,并且r为 0.866,p值降至 0.05 以下。
x = (1, 2, 3, 1, 2, 3),y = (1, 1, 2, 1, 1, 2)。 r = 0.866; p = 0.03。
我们将再次增加样本量。
x = (1, 2, 3, 1, 2, 3, 1, 2, 3),y = (1, 1, 2, 1, 1, 2, 1, 1, 2)。 r = 0.866; p = 0.003。
对于小样本,效应量可能不是很丰富。例如,如果我们测量两个人的身高和体重,我们会发现身高和体重完全相关,并且r = 1。这不会给我们留下深刻印象。如果我们将样本量增加到三或四个,我们仍然可能会发现一个较大的r值,但要知道这很可能是偶然的。在这里,我们可能更多地依赖p值来确定是否发生了有趣的事情。
对于较大的样本量,即使r很小, p值也可能很重要。在这里,我们要确保查看效果大小r ,并且不要对p值赋予过多的权重。
~ ~ ~
r可能并不总是了解相关性大小的最佳方式。例如,如果我告诉你玉米产量和施肥量之间的相关性,“ p = 0.01; r = 0.4” 可能是有意义的。但您可能想知道类似“每增加 5 公斤肥料,玉米产量增加 1000 公斤/公顷。
† 在这种情况下,“极端”意味着相关。
参考 Cohen, J. 1988。行为科学的统计功效分析,第 2 版。劳特利奇。