GAM:平滑样条

机器算法验证 广义加法模型 样条 平滑
2022-04-07 19:26:26

这里有2个问题。您在这些问题上的专业知识将不胜感激。

在 GAM 方法中,从高度灵活的方法开始,然后应用惩罚以实现合理形状所需的平滑度是有意义的。在拟合 GAM 时,我总是使用 P 样条(=惩罚 B 样条)。但是,S. Wood 建议使用惩罚薄板样条,因为它往往会提供最佳的 MSE 性能。

1)有很多不同类型的平滑样条。为什么我们应该使用其他平滑样条而不是惩罚薄板样条,因为它是提供最佳 MSE 性能的一种?

2) S. Wood 写道:

“一般来说,默认的惩罚薄板回归样条往往会提供最佳的 MSE 性能,但它们的设置速度比其他基础要慢。基于结的惩罚三次回归样条(具有基于导数的惩罚)通常在 MSE 性能中排在第二位, P 样条的表现稍差一些。但是 P 样条在非标准情况下很有用”。

对于 P 样条,“非标准情况”是什么意思?什么时候 P 样条可以比惩罚薄板样条更受欢迎?

伍德,SN (2003)。薄板回归样条皇家统计学会杂志。B 系列(统计方法),65(1):95–114。

1个回答

问题一:

为什么不想使用薄板样条?

  1. 为薄板样条设置基函数的计算成本很高。通常,每个(唯一)数据点需要一个基函数;即使 Simon 的截断过程允许在拟合中使用的基函数要少得多,您仍然需要在对它们进行截断/分解之前创建所有基函数,这也是一种代价高昂的特征分解。

  2. 在某些设置中,薄板样条曲线不是最佳的。具有潜在不规则形状的有限区域上的平滑就是这样一个例子。薄板样条不考虑需要平滑的域的边界。例如:

在此处输入图像描述

薄板样条将平滑通过/穿过旋转 U 的两个臂之间的边界;U 的下臂的低值会越过边界泄漏,反之亦然,当函数接近边界时会产生有偏差的函数估计值。

问题2:

P 样条在一些非标准设置中很有用。例如

  1. 它们通常用作自适应样条曲线的基础,其中的平滑函数而变化f(x)x

  2. 形状约束样条,例如被约束为单调递增的样条,很容易从 P 样条基的修改中构建。