我没有具体的例子或任务。我只是使用 b 样条的新手,我想在回归上下文中更好地理解这个函数。
假设我们要评估响应变量和一些预测变量之间的关系。预测变量包括一些数值变量以及一些分类变量。
假设在拟合回归模型后,其中一个数值变量,例如是显着的。之后的一个合乎逻辑的步骤是评估是否需要更高阶多项式,例如:和,以便在不过度拟合的情况下充分解释关系。
我的问题是:
您在什么时候选择 b 样条或简单的高阶多项式。例如在 R 中:
y ~ poly(x1,3) + x2 + x3对比
y ~ bs(x1,3) + x2 + x3您如何使用绘图来告知您在这两者之间的选择以及如果从绘图中不清楚会发生什么(例如:由于大量数据点)
和假设之间的双向交互项
对于不同类型的模型,上述情况如何变化
您是否会考虑从不使用高阶多项式并始终拟合 b 样条并惩罚高灵活性?