在线性回归中,是R2R2值足以评估自变量和因变量之间的关系是否是线性的?

机器算法验证 回归 r平方 诊断
2022-03-29 03:31:21

在线性回归中,是R2值足以评估自变量和因变量之间的关系是否是线性的?它给出了由自变量解释的因变量的可变性。我知道您可以绘制残差与 x 值或残差与 y 值的关系,并查看是否存在模式(如果存在模式,则关系不是线性的)。但是相关系数是否没有提供足够的关于线性的信息?

3个回答

如果您查看Anscombe 的四重奏,您会看到带有噪声的线性示例、带有异常值的线性示例以及具有相同数据的非线性数据集r2,均值和方差。

这张图片来自维基百科的文章 在此处输入图像描述

通常不会。该模型

yi=β+εi,

εiid,E[ε]=0对于之间的关系(yi)(xi)是完全线性的,但有一个r2_

有关什么的其他示例r2没有说线性,请参阅我在Is的回复中的插图R2有用还是危险?.

线性通常通过拟合优度测试来评估;例如,通过在后续回归中包含附加项并测试它们在应用程序中是否既重要又重要。一个人的非线性只是另一个人的随机性,所以没有综合方法。尽管如此,通常r2太粗糙了。

除了上述答案之外,一般回归非线性的常用(计量经济学)检验是Ramsey 的 RESET 检验假设您运行主回归并获得残差ϵ^i和拟合值y^i在里面。那么RESET检验就是在一个辅助回归中检验整体显着性ϵ^i关于权力y^i. 从回归几何中,我们已经知道ϵ^i正交于的零次方和一次方y^i, 所以运行它是有意义的ϵ^iy^i2+y^i3+, 在类似 R 的伪代码中。测试在 Rresettestlmtest和 package 中一样,在 Stata 中和estat ovtestafter中一样regress