在线性回归中,是值足以评估自变量和因变量之间的关系是否是线性的?它给出了由自变量解释的因变量的可变性。我知道您可以绘制残差与 x 值或残差与 y 值的关系,并查看是否存在模式(如果存在模式,则关系不是线性的)。但是相关系数是否没有提供足够的关于线性的信息?
在线性回归中,是R2R2值足以评估自变量和因变量之间的关系是否是线性的?
机器算法验证
回归
r平方
诊断
2022-03-29 03:31:21
3个回答
如果您查看Anscombe 的四重奏,您会看到带有噪声的线性示例、带有异常值的线性示例以及具有相同数据的非线性数据集,均值和方差。
这张图片来自维基百科的文章
通常不会。该模型
,对于之间的关系和是完全线性的,但有一个零。_
有关什么的其他示例没有说线性,请参阅我在Is的回复中的插图有用还是危险?.
线性通常通过拟合优度测试来评估;例如,通过在后续回归中包含附加项并测试它们在应用程序中是否既重要又重要。一个人的非线性只是另一个人的随机性,所以没有综合方法。尽管如此,通常太粗糙了。
除了上述答案之外,一般回归非线性的常用(计量经济学)检验是Ramsey 的 RESET 检验。假设您运行主回归并获得残差和拟合值在里面。那么RESET检验就是在一个辅助回归中检验整体显着性关于权力. 从回归几何中,我们已经知道正交于的零次方和一次方, 所以运行它是有意义的, 在类似 R 的伪代码中。测试在 Rresettest
中lmtest
和 package 中一样,在 Stata 中和estat ovtest
after中一样regress
。