GLM 和 GAM 中的样条曲线

机器算法验证 广义线性模型 样条
2022-03-16 22:01:28

样条线仅在 GAM 模型中可用,而在 GLM 模型中不可用,这是错误的吗?前段时间听到这个,不知道这只是一个误解,还是有一些道理。这是一个插图: http://www.stats.uwo.ca/faculty/bellhouse/glm%20and%20gam.pdf

2个回答

你误会了。样条具有使用派生协变量的线性表示。例如,二次趋势是非线性的,但可以通过以下方式在线性模型中建模:,因此及其平方成线性模型。E[Y|X]=β0+β1X+β2X2X

样条可以简单地视为一个或多个连续或伪连续值协变量的复杂参数化。

@AdamO 的答案是正确的,因为基于样条的拟合当然可以在标准 GLM 框架中完成。这并不是说 GAM 只是 GLM 的一个特例!虽然有一系列模型完全相同并且可以作为 GAM 或具有协变量样条展开的 GLM 框架,但有些 GAM 模型在标准 GLM 框架中不可用。

例如,可以为每个协变量使用平滑样条拟合 GAM 模型。这基本上导致变量的样条扩展,但对二阶导数有惩罚。这导致模型有点超出标准 GLM 框架。

此外,它通常被认为是标准程序,并且内置于大多数 GAM 库中,通过优化样本外误差的各种测量来拟合平滑参数(即样条自由度等),而 GLM 公式通常考虑协变量空间固定的。