我被要求根据为解释变量的方程。我做的第一件事是(天真地)拟合线性回归,。我得到以下结果:yx1,x2,x3,x4y=β0+β1x1+β2x2+β3x3+β4x4+ε
x1x2x3x4const.ObservationsR2Adjusted R2Residual Std. ErrorF Statisticy0.227∗∗(0.100)0.554(0.370)−0.150∗∗∗(0.029)0.155∗∗∗(0.006)−6.821(10.123)320.9620.9572.234(df=27)171.713∗∗∗(df=4;27)
整体成绩不错。但是当我根据残差检查拟合值时,我得到了二次关系。

由于残差不是随机分布的,而且趋势提醒了一些二次函数,这意味着我一开始假设线性的方式实际上并不正确。
在前面的示例中,将更改为解决了问题。然而,在这里,当我尝试类似的方法时,我最终改变了曲率的方向。ylog(y)

我的问题是,为了找到“正确的”非线性模型,还能做些什么?我是否应该尝试对每个术语进行平方和记录以查看它如何影响模型?或者有更简洁的方法吗?如果找不到可以解决此问题的组合,我该怎么办?
编辑。
我添加了散点图矩阵,以显示每个变量之间的关系。老实说,我很难观察到任何具体的事情。对我来说唯一透明的是和之间的正关系。我还发现非常有趣的是和之间的关系,但不完全确定它告诉我什么。yx4yx1
