我正在尝试将 4 节的受限三次样条(自然三次样条)拟合到玩具数据中,尝试遵循 Hastie、Tibshirani、Friedman 2nd ed。5.2.1 p.144-146,方程 5.4 和 5.5。数据:基本上是一个转置的“S”形。R代码是:
n <© 100
x <- (1:n)/n
true <- ((exp(1.2*x)+1.5*sin(7*x))-1)/3
noise <- rnorm(n, 0, 0.15)
y <- true + noise
plot(x,y)
我将结设置为:{.2, .4, .6, .8} 并使用 R 中的非线性 NLS() 函数进行拟合,但无论如何我都无法获得数据的 S 形尝试。
我的方程式错了吗?或者我的方法完全偏离了基础?有什么建议?
(书摘、我的方程式和下面发布的数据图)
自然三次样条结表示为基函数。可以从三次样条的基础开始,并通过施加边界约束来导出简化的基础。例如,从 5.2 节中描述的截断幂级数基础开始,我们得到
可以看出这些基函数中的每一个对于具有零二阶和三阶导数。
我可以问一个更简单的问题吗:网站/书籍说:对于我的自然三次样条方法(即受限三次样条)w/4 节,我需要 4 个基函数。是 Beta_0、Beta_1*x 和 '4 more' 吗?或者确实只有 4 个 beta(从概念上讲,正如我上面所说的)?谢谢你。
感谢您的指导。我正在拟合样条曲线以及许多其他建模协变量,即解释变量。因此,仅用于样条的简单罐装包装是不够的。
当我拟合我的建模数据时,我期望的实际形状是一个非常积极的偏斜分布形式(我试图拟合具有拐点的奇特形状的示例数据,认为这将是对我的样条编码的一个很好的测试功能形式)。
我考虑过窃取函数形式和校准参数化(来自上面的 Python 或来自 R)——但它是三次样条,而不是自然三次样条。
我知道我的 ftn 如何与第一个结的 LHS 呈线性关系。我想下一步是让我看到各种术语取消,实际上我也会与最右边结的 RHS 成线性关系。还要寻找一个被称为“稳定”的 4 期基数。