任何人都可以帮助对在使用平滑/样条线作为预测模型时如何对新数据进行预测进行概念性解释吗?例如,给定一个使用 R 包中创建的模型gamboost
,mboost
使用 p 样条,如何对新数据进行预测?从训练数据中使用了什么?
假设自变量 x 有一个新值,我们要预测 y。是否使用训练模型时使用的结或 df 将样条创建公式应用于此新数据值,然后将训练模型的系数应用于输出预测?
这是 R 的一个示例,对于新数据 mean_radius = 15.99,预测在概念上输出 899.4139 是什么?
#take the data wpbc as example
library(mboost)
data(wpbc)
modNew<-gamboost(mean_area~mean_radius, data = wpbc, baselearner = "bbs", dfbase = 4, family=Gaussian(),control = boost_control(mstop = 5))
test<-data.frame(mean_radius=15.99)
predict(modNew,test)