如果协方差为-150,两个变量之间的关系类型是什么?

机器算法验证 协方差
2022-03-11 09:08:24

两个变量的协方差计算为-150。统计数据说明了两个变量之间的关系是什么?

2个回答

补充Łukasz Deryło 的回答:正如他所写,-150 的协方差意味着负关系。这是强关系还是弱关系取决于变量的方差。下面我绘制了强关系的示例(每个独立变量的方差为 200,因此与方差相比,绝对意义上的协方差很大)和弱关系的示例(每个方差为 2000,因此协方差很小,绝对值,与方差相比)。

强关系,variance <- 200

强关系

弱关系,variance <- 2000

在此处输入图像描述

代码:

library(MASS)

nn <- 100
epsilon <- 0.1
variance <- 2000 # weak relationship

opar <- par(mfrow=c(2,2))
    for ( ii in 1:4 ) {
        while ( TRUE ) {
            dataset <- mvrnorm(n=100,mu=c(0,0),Sigma=rbind(c(2000,-150),c(-150,2000)))
            if ( abs(cov(dataset)[1,2]-(-150)) < epsilon ) break
        }   
        plot(dataset,pch=19,xlab="",ylab="",main=paste("Covariance:",cov(dataset)[1,2]))
    }
par(opar)

编辑:Anscombe 的四重奏

正如 whuber 所说,协方差本身并不能真正告诉我们很多关于数据集的信息。为了说明,我将采用Anscombe 的四重奏并稍作修改。请注意非常不同的散点图都可以具有相同的(四舍五入)协方差 -150:

安斯科姆

anscombe.mod <- anscombe
anscombe.mod[,c("x1","x2","x3","x4")] <- sqrt(150/5.5)*anscombe[,c("x1","x2","x3","x4")]
anscombe.mod[,c("y1","y2","y3","y4")] <- -sqrt(150/5.5)*anscombe[,c("y1","y2","y3","y4")]
opar <- par(mfrow=c(2,2))
    with(anscombe.mod,plot(x1,y1,pch=19,main=paste("Covariance:",round(cov(x1,y1),0))))
    with(anscombe.mod,plot(x2,y2,pch=19,main=paste("Covariance:",round(cov(x2,y2),0))))
    with(anscombe.mod,plot(x3,y3,pch=19,main=paste("Covariance:",round(cov(x3,y3),0))))
    with(anscombe.mod,plot(x4,y4,pch=19,main=paste("Covariance:",round(cov(x4,y4),0))))
par(opar)

最终编辑(我保证!)

最后,这是一个 -150 的协方差,可能是两者之间最脆弱的“负关系”xy可以想象:

最终的

xx <- yy <- seq(0,100,by=10)
yy[9] <- -336.7
plot(xx,yy,pch=19,main=paste("Covariance:",cov(xx,yy)))

它只告诉你关系是消极的。这意味着一个变量的低值往往与另一个变量的高值一起出现。

很难判断这个协方差是大还是小(如果你的关系是强还是弱),因为cov(X,Y)范围从sd(X)sd(Y)sd(X)sd(Y). 所以这取决于你的变量的规模。

要判断这种关系是否强,需要将协方差转换为相关(除以sd(X)sd(Y))。这范围从11许多不同的解释指南可以在网络和教科书中找到。

您也可以对相关性的显着性进行测试。