在为 GAM 选择适当数量的结时,可能需要考虑 x 轴上的数据数量和增量。
如果我们在 x 轴上有 100 个增量,每个增量有 1000 个数据点会怎样。
这里的信息说:
如果未提供它们,则样条的结均匀地放置在该术语所指的协变量值中:例如,如果用 x 的 11 个结样条拟合 101 个数据,则每 10 个(有序)就有一个结x 值。
那么在这个例子中,一个基本的开始应该是 9 节?我只是不确定什么样的结范围适合这个数据集,因为它可能适合非常小到非常大的数字。
set.seed(1)
dat <- data.frame(y = rnorm(10000), x = 100)
library(ggplot)
ggplot(dat, aes(x = x, y = y)) +
geom_point(size= 0.5) +
stat_smooth(method = "gam",
formula = y ~ s(x, bs = "cs"),k=9, col = "black")
如果 k=25 提供了有用的拟合,那么该数据是否合理?