样本相关性分布

机器算法验证 分布 相关性
2022-03-17 16:46:59

假设我有大量数据点(x,y)并且 Pearson 的相关性是

corr(X,Y)=ρ

关于我期望在大小样本中观察到的相关性,我可以合理地说些什么n? 如果样本相关性是ρs,大致是什么价差ρs? ρs有偏见?

如果我们做一些像正态性这样的假设,我们可以计算出准确的似然函数吗?ρs作为一个函数ρ?

(最终,我想知道观察到的高相关性是否是侥幸的问题,而我所拥有的只是样本量和相关性。)

1个回答

引用关于 Fisher 变换的 Wikipedia 文章

如果(X,Y)具有二元正态分布,如果(Xi,Yi)用于形成样本相关系数的对r是独立的i=1,,n,然后

z=12ln1+r1r=arctanh(r)
近似正态分布,均值 12ln1+ρ1ρ, 和标准误 1N3, 在哪里N是样本量。