我正在尝试使用 R 为 GLM 拟合样条曲线。拟合样条曲线后,我希望能够采用生成的模型并在 Excel 工作簿中创建建模文件。
例如,假设我有一个数据集,其中 y 是 x 的随机函数,并且斜率在特定点突然变化(在这种情况下 @x=500)。
set.seed(1066)
x<- 1:1000
y<- rep(0,1000)
y[1:500]<- pmax(x[1:500]+(runif(500)-.5)*67*500/pmax(x[1:500],100),0.01)
y[501:1000]<-500+x[501:1000]^1.05*(runif(500)-.5)/7.5
df<-as.data.frame(cbind(x,y))
plot(df)
我现在适合这个使用
library(splines)
spline1 <- glm(y~ns(x,knots=c(500)),data=df,family=Gamma(link="log"))
我的结果显示
summary(spline1)
Call:
glm(formula = y ~ ns(x, knots = c(500)), family = Gamma(link = "log"),
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-4.0849 -0.1124 -0.0111 0.0988 1.1346
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.17460 0.02994 139.43 <2e-16 ***
ns(x, knots = c(500))1 3.83042 0.06700 57.17 <2e-16 ***
ns(x, knots = c(500))2 0.71388 0.03644 19.59 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Gamma family taken to be 0.1108924)
Null deviance: 916.12 on 999 degrees of freedom
Residual deviance: 621.29 on 997 degrees of freedom
AIC: 13423
Number of Fisher Scoring iterations: 9
此时,我可以在 r 中使用 predict 函数并获得完全可以接受的答案。问题是我想使用模型结果在 Excel 中构建工作簿。
我对预测函数的理解是,给定一个新的“x”值,r 将该新 x 插入适当的样条函数(值高于 500 的函数或值低于 500 的函数),然后将结果相乘它通过适当的系数,从那时起,它就像任何其他模型项一样对待。如何获得这些样条函数?
(注意:我意识到对数关联的伽马 GLM 可能不适合所提供的数据集。我不是在询问如何或何时拟合 GLM。我提供该集作为可重复性目的的示例。)