样本相关性的期望值和方差

机器算法验证 相关性 方差 期望值
2022-03-26 04:14:59

我一直在寻找样本相关系数的期望值和方差的表达式。我发现的大多数来源都说 作为样本相关系数的方差,但是这假设遵循二元正态分布。

Var(Cor(X,Y))(1ρ2)2n1,
XY

似乎还有几种方法可以对函数进行级数展开以近似相关函数的矩。但是,我不清楚这些假设是什么(例如,正态性),也不清楚哪一个是最新的表达式。

那么,有没有人知道相关系数(Pearsons)的期望值和方差的表达式(近似与否),它不假设随机变量的特定分布?

更新:

我的一些资料来源:

假设二元正态分布:

发表作品:

Hotelling (1953):关于相关系数及其变换的新观点。( http://www.jstor.org/stable/2983768 )

费舍尔(1921):(https://digital.library.adelaide.edu.au/dspace/bitstream/2440/15169/1/14.pdf

网络来源:

Gerstman ( http://www.sjsu.edu/faculty/gerstman/StatPrimer/correlation.pdf )

堆栈交换(相关系数的标准误差

维基百科(https://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient#Inference

荷兰(http://strata.uga.edu/6370/lecturenotes/correlation.html

没有说明双变量正态性的假设,但应该假设:

堆栈溢出(https://stackoverflow.com/questions/16097453/how-to-compute-p-value-and-standard-error-from-correlation-analysis-of-rs-cor

不幸的是,我不明白这一点,但这似乎是一种富有成效的方法:

Hawkings (1989) - 使用 U 统计推导 Fischer 的 Z 统计的渐近分布 ( http://www.jstor.org/stable/2685369 )

1个回答

我不能给你一个表达,但这里有几篇涵盖一些非正常情况的文章:

Browne, MW 和 Shapiro, A. (1986)。一般条件下样本相关系数的渐近协方差矩阵。线性代数及其应用,82, 169-176。

阿拉斯加州盖恩 (1951)。从非正态宇宙中抽取的任意大小的随机样本中积矩相关系数的频率分布。Biometrika, 38, 219-247。

科瓦尔斯基,C.(1972 年)。关于非正态性对样本积矩相关系数分布的影响。应用统计,21,1-12。

Subrahmaniam, K., & Gajjar, AV (1980)。样本相关系数的某些变换对非正态性的鲁棒性。多元分析杂志,10, 60-77。

Yuan, K.-H. 和 Bentler, PM (2000)。对某些类别的非正态分布的相关系数的推论。多元分析杂志,72,230-248。