作为线性回归的假设,误差分布的正态性有时会被错误地“扩展”或解释为需要 y 或 x 的正态性。
是否可以构建一个场景/数据集,其中 X 和 Y 是非正态的,但误差项是,因此获得的线性回归估计是有效的?
作为线性回归的假设,误差分布的正态性有时会被错误地“扩展”或解释为需要 y 或 x 的正态性。
是否可以构建一个场景/数据集,其中 X 和 Y 是非正态的,但误差项是,因此获得的线性回归估计是有效的?
用图片扩展 Hong Oois 的评论。这是一个数据集的图像,其中没有一个边缘是正态分布的,但残差仍然是,因此线性回归的假设仍然有效:
该图像由以下 R 代码生成:
library(psych)
x <- rbinom(100, 1, 0.3)
y <- rnorm(length(x), 5 + x * 5, 1)
scatter.hist(x, y, correl=F, density=F, ellipse=F, xlab="x", ylab="y")