线性回归的线性假设

机器算法验证 回归 机器学习 线性的 假设
2022-03-26 13:04:53

根据这个网站,如果散点图遵循线性模式(即不是曲线模式),则满足线性假设。

这是一个不满足假设的示例。

在此处输入图像描述

但据我所知,唯一真正的要求是数据在未知系数中必须是线性的,这意味着我们可以具有抛物线形状并且仍然是线性的。因此,我们没有违反线性假设。

我是不是理解有误?

2个回答

您仍然需要具有响应线性的原始变量的一个或多个函数。

您是正确的,线性回归在系数中是线性的,但是在系数乘以的事物中它同样是线性的。(这里我们说的是线性映射,而不是“具有直线关系”,尽管当预测变量中包含常数项时,这两者是相关的概念。)

对于多元回归,我们写E(Y|x)=Xβ, 在哪里X是实际提供给回归(和常数)的变量矩阵。这是线性的β但它在列中同样是线性的X.

在简单回归的情况下,例如,如果您可以编写一个方程Y=β0+β1t(x)+ϵ, 或者E(Y|x)=β0+β1t(x)这在提供的变量中是线性的(1,x), 在哪里x=t(x).

如果你知道一个t(x)提供给回归,这意味着你不需要有一个直线关系yx,但仍然存在线性关系。

有多种方法可以使用线性方程对非线性关系进行建模,包括多项式、各种回归样条、三角函数等,它们可以具有仍然是(多个)线性回归模型的特性。

这里的混淆主要是语义上的:1)线性回归和2)变量之间的线性依赖/关系。图中所示的预测变量和响应之间的关系显然是非线性的。另一方面,您仍然可以通过以下类型的线性模型对其进行拟合:y=a0+a1x+a3x2或任何其他可能的非线性函数的线性组合。