两个变量的协方差计算为-150。统计数据说明了两个变量之间的关系是什么?
如果协方差为-150,两个变量之间的关系类型是什么?
机器算法验证
协方差
2022-03-11 09:08:24
2个回答
补充Łukasz Deryło 的回答:正如他所写,-150 的协方差意味着负关系。这是强关系还是弱关系取决于变量的方差。下面我绘制了强关系的示例(每个独立变量的方差为 200,因此与方差相比,绝对意义上的协方差很大)和弱关系的示例(每个方差为 2000,因此协方差很小,绝对值,与方差相比)。
强关系,variance <- 200:
弱关系,variance <- 2000:
代码:
library(MASS)
nn <- 100
epsilon <- 0.1
variance <- 2000 # weak relationship
opar <- par(mfrow=c(2,2))
for ( ii in 1:4 ) {
while ( TRUE ) {
dataset <- mvrnorm(n=100,mu=c(0,0),Sigma=rbind(c(2000,-150),c(-150,2000)))
if ( abs(cov(dataset)[1,2]-(-150)) < epsilon ) break
}
plot(dataset,pch=19,xlab="",ylab="",main=paste("Covariance:",cov(dataset)[1,2]))
}
par(opar)
编辑:Anscombe 的四重奏
正如 whuber 所说,协方差本身并不能真正告诉我们很多关于数据集的信息。为了说明,我将采用Anscombe 的四重奏并稍作修改。请注意非常不同的散点图都可以具有相同的(四舍五入)协方差 -150:
anscombe.mod <- anscombe
anscombe.mod[,c("x1","x2","x3","x4")] <- sqrt(150/5.5)*anscombe[,c("x1","x2","x3","x4")]
anscombe.mod[,c("y1","y2","y3","y4")] <- -sqrt(150/5.5)*anscombe[,c("y1","y2","y3","y4")]
opar <- par(mfrow=c(2,2))
with(anscombe.mod,plot(x1,y1,pch=19,main=paste("Covariance:",round(cov(x1,y1),0))))
with(anscombe.mod,plot(x2,y2,pch=19,main=paste("Covariance:",round(cov(x2,y2),0))))
with(anscombe.mod,plot(x3,y3,pch=19,main=paste("Covariance:",round(cov(x3,y3),0))))
with(anscombe.mod,plot(x4,y4,pch=19,main=paste("Covariance:",round(cov(x4,y4),0))))
par(opar)
最终编辑(我保证!)
最后,这是一个 -150 的协方差,可能是两者之间最脆弱的“负关系”和可以想象:
xx <- yy <- seq(0,100,by=10)
yy[9] <- -336.7
plot(xx,yy,pch=19,main=paste("Covariance:",cov(xx,yy)))
它只告诉你关系是消极的。这意味着一个变量的低值往往与另一个变量的高值一起出现。
很难判断这个协方差是大还是小(如果你的关系是强还是弱),因为范围从到. 所以这取决于你的变量的规模。
要判断这种关系是否强,需要将协方差转换为相关(除以)。这范围从到许多不同的解释指南可以在网络和教科书中找到。
您也可以对相关性的显着性进行测试。
其它你可能感兴趣的问题



