斯皮尔曼ρρ作为皮尔逊的函数rr

机器算法验证 相关性 均匀分布 皮尔逊-r 斯皮尔曼罗 系词
2022-03-27 18:57:34

通常谈论线性相关,Pearson'sr, 在两个随机变量之间{(x1,y1),(x2,y2),,(xn,yn)}有两个组成部分:a) copula 和 b) 的边际分布xy. 相比之下,秩相关,Spearman 的ρ, 仅取决于 copula。

提醒一下,计算rρ是相同的,除了在ρ,变量首先转换为有序等级R(.)=1,2,,n.

r=Cov(xi,yi)Var(xi)Var(yi),ρ=Cov(R[xi],R[yi])Var(R[xi])Var(R[yi]).

根据定义,排名遵循均匀分布。让我们进一步假设非转换的正态双变量分布xy.

现在我的问题是:我想表达ρ作为一种转变r. 看起来这应该是一个相当简单的函数,它以某种方式涉及法线到制服之间的映射。

我的直觉ρ是它是一个加权函数r在分布中间的小距离上放置大权重;同样,这似乎与正态分布本身成正比。

有没有人能算出具体的表达方式?

1个回答

我想我找到了答案。在 Pearson 的“关于确定相关性的进一步方法”(1907 年)中,他得出以下表达式:

r=2sin(π6ρ),
这意味着,
ρ=6πsin1r2.
这让我意识到对于双变量正常情况,rρ根据经验,它们几乎相同。如果有人对更奇特的分布有答案,我仍然会很好奇,但这是一个单独的问题。