我不太了解这个概念,需要帮助。
我正在选择是使用线性模型还是在模型公式中应用非线性变换。为了进行诊断,我快速绘制了我的数据:
plotalldaily <- ggplot(amsd, aes(ImpressionsA, Leads.T)) + geom_point(color="orange")+geom_smooth()

从图中,我猜想我的 x 变量的三次多项式变换应该给我一个更好的模型拟合。我提到了这个:http ://www3.nd.edu/~rwilliam/stats2/l61.pdf 。在第 5 页,有关于三次项的多项式模型的解释。
所以我使用两个公式检查了模型的拟合——一个是非线性变换,另一个是简单的线性:
test1 <- lm(Leads.T~ImpressionsA, amsd)
test2 <- lm(Leads.T~I(ImpressionsA^3), amsd)
奇怪的是,线性关系给了我更好的模型拟合:更低的标准化误差、更高的 R 平方和更好的残差分布。
TEST 1 Residuals

TEST 2 Residuals

我不知道该怎么做。我应该适合哪种模型,我应该尝试哪些其他类型的转换?