我正在寻找如何(直观地)向一年级学生解释简单的线性相关性。
可视化的经典方法是给出带有直线回归线的 Y~X 散点图。
最近,我想到了通过在绘图中添加 3 个更多图像来扩展这种类型的图形的想法,给我留下:y~1 的散点图,然后是 y~x,resid(y~x)~x,最后是残差(y~x)~1(以平均值为中心)
以下是此类可视化的示例:
以及生成它的 R 代码:
set.seed(345)
x <- runif(50) * 10
y <- x +rnorm(50)
layout(matrix(c(1,2,2,2,2,3 ,3,3,3,4), 1,10))
plot(y~rep(1, length(y)), axes = F, xlab = "", ylim = range(y))
points(1,mean(y), col = 2, pch = 19, cex = 2)
plot(y~x, ylab = "", )
abline(lm(y~x), col = 2, lwd = 2)
plot(c(residuals(lm(y~x)) + mean(y))~x, ylab = "", ylim = range(y))
abline(h =mean(y), col = 2, lwd = 2)
plot(c(residuals(lm(y~x)) + mean(y))~rep(1, length(y)), axes = F, xlab = "", ylab = "", ylim = range(y))
points(1,mean(y), col = 2, pch = 19, cex = 2)
这引出了我的问题:我将不胜感激有关如何增强此图的任何建议(使用文本、标记或任何其他类型的相关可视化)。添加相关的 R 代码也会很好。
一个方向是添加 R^2 的一些信息(通过文本或以某种方式添加表示引入 x 之前和之后的方差大小的行)另一种选择是突出显示一个点并显示它是如何“更好解释“感谢回归线。任何输入将不胜感激。