作为参数的 Spearman 相关性

机器算法验证 相关性 非参数 斯皮尔曼罗 系词
2022-04-06 20:17:32

双变量样本的 Spearman 等级相关性{(x1,y1),(x2,y2),,(xn,yn)}通常被定义为观察的等级之间的相关性,但是这个的人口类比是什么?我想我记得在连续情况下至少可以将其视为Corr[F(X),G(Y)]在哪里FG是分布函数XY. 这是有道理的,因为在计算示例中排名之间的相关性时,您总是可以除以n并查看经验分布函数的值。无论如何,还有另一种解释吗?是否可以在分布级别以某种方式将其定义为相关性以外的东西?

1个回答

在一些关于 copula 的工作中给出了解释。

例如,参见Embrechts 等人(2001) [1] 的第 15 页,其中的 Spearman 相关性为(X,Y)T

ρS(X,Y)=3(P{(XX~)(YY)>0}P{(XX~)(YY)<0})

在哪里(X,Y)T,(X~,Y~)T(X,Y)T是独立的副本。(然后它继续显示您对该定义的解释。)

[1] Paul Embrechts、Filip Lindskog 和 Alexander McNeil(2001 年),
“使用 Copulas 建模依赖性和风险管理应用”
http://www.risklab.ch/ftp/papers/DependenceWithCopulas.pdf
替代链接