我有兴趣学习(和实施)多项式插值的替代方法。
但是,我很难很好地描述这些方法的工作原理、它们之间的关系以及它们的比较方式。
我希望您能就这些方法或替代方案有用的优点/缺点/条件提供意见,但对文本、幻灯片或播客的一些好的参考就足够了。
我有兴趣学习(和实施)多项式插值的替代方法。
但是,我很难很好地描述这些方法的工作原理、它们之间的关系以及它们的比较方式。
我希望您能就这些方法或替代方案有用的优点/缺点/条件提供意见,但对文本、幻灯片或播客的一些好的参考就足够了。
基本 OLS 回归是将函数拟合到一组数据的非常好的技术。的整个可能范围内恒定的直线。这可能不适用于特定情况。例如,数据有时会显示出曲线关系。这可以通过将回归到的来解决。不同的变换是可能的。和之间的关系是单调的但不断减小的情况下,对数变换可以使用。另一种流行的选择是使用多项式,其中通过将提高到一系列幂(例如、等)来形成新项。该策略易于实施,您可以将拟合解释为告诉您数据中存在多少“弯曲”(其中弯曲的数量等于所需的最高功率减去 1)。
然而,基于对数或协变量指数的回归只有当这是真实关系的确切性质时才会最佳拟合。和之间存在与这些变换提供的可能性不同的曲线关系是很合理的。因此,我们提出了另外两种策略。第一种方法是loess,这是在移动窗口上计算的一系列加权线性回归。这种方法较旧,更适合探索性数据分析。
另一种方法是使用样条。最简单的是,样条曲线是一个新术语,仅适用于范围的一部分。例如,的范围可能从 0 到 1,而样条项的范围可能仅从 0.7 到 1。在这种情况下,0.7 是节。一个简单的线性样条项可以这样计算: 并将添加到您的模型中,除了原始
我所知道的对这些主题的最简单介绍是:
Cosma Shalizi 在他的讲座课程Advanced Data Analysis from an Elementary Point of View的在线笔记在这个主题上非常好,从插值和回归是同一问题的两种方法的角度来看问题。我会特别提请您注意有关平滑方法和样条的章节。