我对 R 中可用的推理测试感兴趣,该测试测试 Pearson 的而不是是否. 如果测试允许相关矩阵和参与者数量作为输入变量,那就太好了。
如何测试相关性是否等于1?
机器算法验证
假设检验
相关性
统计学意义
置信区间
2022-04-06 20:28:47
2个回答
我会争辩说没有任何测试要做。如果样本相关性不是 1,那么你拒绝确定无疑。
相关性为 1 意味着这些点不能像在以下情况下那样偏离对角线.
编辑
set.seed(2019)
x <- rexp(1000)
y <- 3*x
plot(x,y)
V <- rep(NA,10000)
for (i in 1:length(V)){
print(i)
idx <- sample(seq(1,length(x),1),replace=T)
V[i] <- cor(x[idx],y[idx])
}
summary(V)
散点图的点锁定在对角线上,每个样本相关性都是 1。您可以尝试使用其他分布和样本大小。
当我将高斯 copula 的参数设置为 1 时,这会变得有趣——而且我不完全确定总体水平的数学。
library(copula)
set.seed(2019)
gc <-ellipCopula("normal", param = 1, dim = 2)#, dispstr = "un")
norm_exp <- mvdc(gc,c("norm","exp"),list(list(mean=0,sd=1),list(rate=1)))
V <- rep(NA,10000)
for (i in 1:length(V)){
print(i)
D_ne <- rMvdc(1000, norm_exp)
x <- D_ne[,1]
y <- D_ne[,2]
V[i] <- cor(x[idx],y[idx])
}
plot(x,y)
summary(V)
我仍然不认为这种关系给出了 1 的总体 Pearson 相关性(这种关系是完全单调的,但不是线性的),但这个结果让我感到惊讶。我期待另一个直线图。
为了捍卫我关于总体 Pearson 相关性不是 1 的断言,我参考了 pg 中的定理 4.5.7。Casella & Berger's Statistical Inference第二版第 172 页:"当且仅当存在数字和这样。”自从我之间的关系(正常变量)和(指数)是非线性的,不可能有这样的和.
卡塞拉、乔治和罗杰 L. 伯杰。统计推断。第 2 版,Cengage Learning & Wadsworth,2002 年。
使用 Fisher Z 变换是一种方法(通常用于置信区间),自举将是另一种方法。这是 Pearson Product Moment Correlation Coefficient 的 Fisher Z 变换的简短文章https://www.statisticshowto.datasciencecentral.com/fisher-z/