在 RI 中data,我想进行回归分析,找到一个可以拟合数据的函数。所以head(data)给
promotion new_users
39.5 100
36.1 79
0.0 18
为了找到拟合数据的最佳回归函数,我绘制了回归模型的残差,以查看残差是否系统地接近零线。但我不知道哪种转换是最好的转换。在这里,我尝试进行线性变换、sqrt变换,最后是对数变换。
lm.linear = lm(formula= data$new_users ~ data$promotion )
plot(resid(lm.linear), col="blue")
lm.sqrt = lm(formula= data$new_users ~ sqrt(data$promotion) )
plot(resid(lm.sqrt), col="blue")
lm.log = lm(formula= data$new_users ~ log(0.1+data$promotion ))
plot(resid(lm.log), col="blue")
如果我只是简单地绘制数据和拟合回归函数,我看不出哪个回归函数最适合数据,因为它们非常相似。哪种转换是最好的,还有另一种方法可以找出最好的转换吗?
谢谢。
要查看是否可以使用泊松回归模型,我键入
model=glm(data$new_users ~data$promotion, familiy="poisson", data=data)
我使用拟合优度来查看模型是否合适。
with(m1, cbind(res.deviance = deviance, df = df.residual,
p = pchisq(deviance, df.residual, lower.tail=FALSE)))
我得到一个低 p 值意味着该模型非常适合?
此外,假设我们想要比较两个毒回归模型(一个data来自另一个数据集的 poission regr. model 和另一个来自另一个数据集的模型data_new),看看两者之间是否存在显着差异,如何做到这一点?我认为可以使用 anova 测试来解决这个问题。


