为什么我复制的 Silver & Dunlap 1987 没有成功?

机器算法验证 r 相关性 数据转换 模拟 正常化
2022-04-07 20:52:14

我正在尝试复制Silver & Dunlap (1987)我只是在比较平均相关性或平均 z 变换相关性和反向变换。我似乎没有复制他们发现的偏差中的不对称性(对我来说,反向变换的 zs 并不比 rs 更接近总体值)。有什么想法吗?有没有可能是 1987 年的计算能力对太空的探索还不够?

# Fisher's r2z
fr2z <- atanh
# and back
fz2r <- tanh

# a function that generates a matrix of two correlated variables
rcor <- function(n, m1, m2, var1, var2, corr12){
    require(MASS)
    Sigma <- c(var1, sqrt(var1*var2)*corr12, sqrt(var1*var2)*corr12, var2)
    Sigma <- matrix(Sigma, 2, 2)
    return( mvrnorm(n, c(m1,m2), Sigma, empirical=FALSE) )
    }

使用这些函数,很容易查看一堆相关性(基本上复制 silver 和 dunlap 1987),并查看平均相关性与平均 z 分数和反向变换之间的差异。这里只有一个。

r <- 0.9
Y <- replicate(20000, rcor(10, 0, 0, 1, 1, r))
rs <- apply(Y, 3, function(x) cor(x[,1], x[,2]))
mean(rs) - r
zs <- fr2z(rs)
fz2r( mean(zs) ) - r

只需查看 10 的样本量和 0.1、0.5 和 0.9 的相关性,这些就是结果。

     rho  r bias   z bias
     0.1  -0.006   0.006
     0.5  -0.024   0.021
     0.9  -0.011   0.011

这些来自 Silver & Dunlap 的表 1。

     rho  r bias   z bias
     0.1  -0.007   0.003
     0.5  -0.025   0.001
     0.9  -0.011  -0.007

这些是完全不同的结果。从我的测试中,我看到这只是偏差方向的问题,而不是幅度问题。但是,在已发表的论文中,他们发现 z 的幅度要小得多。我找不到已发布的非复制品。

1个回答

对我来说,Silver & Dunlap 表中 0.5 的r bias条目rho看起来与我最不一样。但是,话虽如此,它确实与您的估计值非常接近。

不幸的是,我目前无法访问 Silver & Dunlap 的论文,但谷歌搜索确实找到了一篇与你所做的类似研究的最近论文。这是

RL Gorsuch 和 CS Lehmann (2010),相关系数:平均偏差和置信区间扭曲社会科学方法与测量杂志,第一卷。1,没有。2, 52–65。

尤其是他们的表 3,至少从肉眼看来,这似乎证实了你的结果。

我当然不能保证期刊(或整篇论文)的质量,据我估计,它看起来很新,而且边缘有点粗糙。警告讲师。

对于主要在多元正态框架中对相关性(简单、部分和多重)推断的深入、更具理论性的处理,一个很好的参考是

FA Graybill,线性模型的理论和应用,达克斯伯里出版社,1976 年,第 11 章

不过,它并不太关心小样本性能或应用方面。