了解 Spearman 等级相关中的 p 值

机器算法验证 p 值 斯皮尔曼罗
2022-02-27 09:29:41

n=200我有一些非负数且非正态分布的样本对(或其附近)。我认为这些变量对是相关的,可能是线性的。

在这些数据集上计算 Spearman 的等级相关性会得到一些奇怪的结果。相关系数表明变量对是弱正相关rho的(例如大约0.4),但 p 值非常低(例如4.1e-10)。

我对此的模糊理解是变量是弱正相关的,但不相关的变量产生相同相关性的概率非常低。这是否意味着我们可以合理地确定存在正相关或我是否误解了?

1个回答

如果不存在相关性,您对 p 值的理解是正确的(从技术上讲,它是看到观察到的相关性或更强的概率)。

什么是强相关或弱相关取决于上下文,通常最好绘制数据,或者生成具有给定相关性的随机数据,然后绘制它以了解相关性的强度。

p 值由观察到的相关性和样本量决定,因此如果样本量足够大,非常弱的相关性可能很重要,这意味着您所看到的可能是真实的,而不是偶然的,它可能不是很有趣的。另一方面,对于小样本量,您可以获得非常强的相关性,这在统计上并不显着,这意味着机会和没有关系是一个合理的解释(想想 2 点,即使存在相关性几乎总是 1 或 -1没有关系,因此大小可以很容易地归因于机会)。