当 r = 0 时,二次关系的含义是什么?

数据挖掘 共线性 皮尔逊相关系数
2021-10-06 10:35:53

一个网站(第 4 页)说:

相关系数是线性关系的度量,因此 r = 0 的值并不意味着变量之间没有关系。例如,在下面的散点图中,它暗示没有(线性)相关,但存在完美的二次关系。

完美的二次关系是什么意思?

2个回答

下面我绘制了一个线性和二次函数, y=50x+3y=5x21000, 分别。

在计算任何东西之前,我们可以观察到 xy以某种形式相互关联。如果我们用文字来描述,我们可以说左边的情节是x 增加所以 y.

同样,对于正确的情节,我们可以说 x 从左侧向 0 移动, y 向 0 递减,并且随着 x 从 0 向右移动, y 增加。

实际上, xy 在左图中具有完美的线性关系,而 xy在右图中具有完美的二次关系。我们可以这样说是因为两个图中的点都位于红线上

在此处输入图像描述

如果我们更进一步,计算 x 和 y 之间的相关性。

我们观察到线性关系 xy 相关性为 1。相反,对于二次关系, xy 相关性为 0。

您将在下面找到上述图表的 R 代码,此外,还有用于计算相关系数的代码

set.seed(1)
library(ggplot2)
library(dplyr)
library(gridExtra)

# Linear Function
linear = function(x){(50)*x + 3 }

# Quadratic Function
quadratic = function(x){(5)*x^2 - 1000}

# Create Data Frame
df = data.frame(x = c(-20:20), 
                y = c(sapply(-20:20, quadratic),sapply(-20:20, linear)), 
                type = c(rep('quadratic',41),rep('linear',41)) )

# Plot Functions
lp = ggplot(subset(df,type == 'linear'), aes(x,y)) + geom_point() + 
  stat_function(fun=linear, colour="red") + ggtitle('Linear Relationship')

qp = ggplot(subset(df,type == 'quadratic'), aes(x,y)) + geom_point() + 
  stat_function(fun=quadratic, colour="red") + ggtitle('Quadratic Relationship')

grid.arrange(lp, qp, ncol=2)


# Calculate correlation coefficients
df %>% filter(type =='linear') %>% select(x,y) %>% cor %>% (function(x){x[1,2]})
df %>% filter(type =='quadratic') %>% select(x,y) %>% cor %>% (function(x){x[1,2]})

完美的二次关系意味着该点完全位于某个抛物线上。

考虑一个完美的线性关系:位于一条直线上的点,例如 (1,2), (2,5), 和 (5,14) 那些在 y=3x1.

同上,点完全位于某个抛物线上,给出了完美的二次关系。考虑(2,4), (1,1), (0,0), (1,1), 和 (2,4) 躺在 y=x2.