一个网站(第 4 页)说:
相关系数是线性关系的度量,因此 r = 0 的值并不意味着变量之间没有关系。例如,在下面的散点图中,它暗示没有(线性)相关,但存在完美的二次关系。
完美的二次关系是什么意思?
一个网站(第 4 页)说:
相关系数是线性关系的度量,因此 r = 0 的值并不意味着变量之间没有关系。例如,在下面的散点图中,它暗示没有(线性)相关,但存在完美的二次关系。
完美的二次关系是什么意思?
下面我绘制了一个线性和二次函数, 和 , 分别。
在计算任何东西之前,我们可以观察到 和 以某种形式相互关联。如果我们用文字来描述,我们可以说左边的情节是 增加所以 .
同样,对于正确的情节,我们可以说 从左侧向 0 移动, 向 0 递减,并且随着 从 0 向右移动, 增加。
实际上, 和 在左图中具有完美的线性关系,而 和 在右图中具有完美的二次关系。我们可以这样说是因为两个图中的点都位于红线上
如果我们更进一步,计算 x 和 y 之间的相关性。
我们观察到线性关系 和 相关性为 1。相反,对于二次关系, 和 相关性为 0。
您将在下面找到上述图表的 R 代码,此外,还有用于计算相关系数的代码
set.seed(1)
library(ggplot2)
library(dplyr)
library(gridExtra)
# Linear Function
linear = function(x){(50)*x + 3 }
# Quadratic Function
quadratic = function(x){(5)*x^2 - 1000}
# Create Data Frame
df = data.frame(x = c(-20:20),
y = c(sapply(-20:20, quadratic),sapply(-20:20, linear)),
type = c(rep('quadratic',41),rep('linear',41)) )
# Plot Functions
lp = ggplot(subset(df,type == 'linear'), aes(x,y)) + geom_point() +
stat_function(fun=linear, colour="red") + ggtitle('Linear Relationship')
qp = ggplot(subset(df,type == 'quadratic'), aes(x,y)) + geom_point() +
stat_function(fun=quadratic, colour="red") + ggtitle('Quadratic Relationship')
grid.arrange(lp, qp, ncol=2)
# Calculate correlation coefficients
df %>% filter(type =='linear') %>% select(x,y) %>% cor %>% (function(x){x[1,2]})
df %>% filter(type =='quadratic') %>% select(x,y) %>% cor %>% (function(x){x[1,2]})
完美的二次关系意味着该点完全位于某个抛物线上。
考虑一个完美的线性关系:位于一条直线上的点,例如 , , 和 那些在 .
同上,点完全位于某个抛物线上,给出了完美的二次关系。考虑, , , , 和 躺在 .