线性回归中的正态假设

机器算法验证 回归 线性模型 假设
2022-03-12 18:43:57

作为线性回归的假设,误差分布的正态性有时会被错误地“扩展”或解释为需要 y 或 x 的正态性。

是否可以构建一个场景/数据集,其中 X 和 Y 是非正态的,但误差项是,因此获得的线性回归估计是有效的?

1个回答

用图片扩展 Hong Oois 的评论。这是一个数据集的图像,其中没有一个边缘是正态分布的,但残差仍然是,因此线性回归的假设仍然有效:

在此处输入图像描述

该图像由以下 R 代码生成:

library(psych)
x <- rbinom(100, 1, 0.3)
y <- rnorm(length(x), 5 + x * 5, 1)

scatter.hist(x, y, correl=F, density=F, ellipse=F, xlab="x", ylab="y")