线性回归的假设

数据挖掘 线性回归
2021-10-09 08:27:05

简单来说,线性回归的假设是什么?

我只想知道什么时候可以将线性回归模型应用于我们的数据集。

1个回答

有三个主要假设(从统计上严格来说):

  1. 因变量和回归变量之间存在线性关系(下右图)​​,这意味着您创建的模型实际上适合数据。 在此处输入图像描述

  2. 数据的误差或残差呈正态分布且相互独立。 在此处输入图像描述

  3. 同方差性。这意味着回归线周围的方差对于预测变量的所有值都是相同的。 在此处输入图像描述

更新 2: : 多重共线性不是一个假设,而是一个健全性检查,特别是如果模型的可解释性很重要(感谢 Ricardo Cruz 的评论)。当自变量不相互独立时,就会出现多重共线性。解释变量之间的多重共线性可能导致参数拟合不稳定(感谢 KT. 指出这一点))。有相关矩阵(Pearson's Bivariate Correlation)、方差膨胀因子等测试可用于验证这一点。