经典低通滤波(使用 IIR 或 FIR)与通过局部 N 次多项式回归和/或插值(在上采样的情况下)的“平滑”之间有什么区别,特别是在 N 大于 1 的情况下但少于回归拟合中使用的局部点数。
滤波和多项式回归平滑之间的区别?
低通滤波和多项式回归平滑都可以看作是函数的近似值。但是,这样做的方法是不同的。这里要问的关键问题是“你能根据另一个来做吗?” 简短的回答是“不总是”,原因如下所述。
当通过过滤进行平滑时,关键操作是卷积,其中,在频域中转化为在哪里表示离散傅里叶变换(和逆)。离散傅里叶变换(例如) 提供了一个近似值作为三角函数的总和。什么时候是一个低通滤波器,保留了较少数量的低频分量,并且在被平滑。这通过使用三角函数作为基函数在函数逼近的上下文中设置低通滤波,但值得重新审视卷积公式以注意在滤波时,y(n)(滤波器的输出)取决于以及过去样本的加权和(这里的权重由“形状”决定)。(类似的考虑当然适用于 IIR 滤波器,加上过去的值以及)
但是,当通过一些 n 次多项式进行平滑时,插值的输出仅取决于以及(不同)基函数(也称为单项式)的混合。这些不同的基函数是什么?这是一个常数(), 一行 (), 抛物线 () 等等(请参考这个以获得很好的说明)。通常,当及时处理等距离的样本时以及出于准确性的原因,使用的是多项式的牛顿形式。我引用这个的原因是因为通过它很容易看出,在执行线性插值时,您可以构造一个滤波器内核,它返回可用样本的线性加权和,就像低阶插值多项式将使用“线”进行插值一样两个样本之间。但在更高的程度上,这两种近似方法会返回不同的结果(由于基函数的差异)。
正如我上面写的,不考虑过去的价值不严格。这是一个微妙的点。因为通常,在构建多项式时,不考虑给定区间之外的值(信号的“过去”和“未来”)。然而,可以通过将导数固定在区间的边缘来包含这些。如果重复执行此操作(如非重叠滑动窗口),那么将有效地考虑 x(n) 的“过去样本”。(这是样条曲线使用的技巧,实际上双三次插值有一个卷积表达式。但是,请注意这里的解释在谈论样条曲线时是不同的-注意关于标准化的要点-)
有时使用滤波作为插值的原因,例如在“Sinc 插值”的情况下,是因为从物理的角度来看它也是有意义的。时域中的带限系统(例如(线性)放大器或光学系统中的透镜)的理想化表示是 sinc 脉冲。sinc 脉冲的频域表示是一个矩形“脉冲”. 因此,在很少假设的情况下,我们预计缺失值或多或少靠近其邻居(当然,在限制范围内)。如果这是用一些 n 阶多项式(对于更高的 n)执行的,那么我们以某种方式“修复”缺失值与其邻居相关的方式,这可能并不总是现实的(为什么一个击中麦克风的波前被固定为具有形状例如?它假设声源的行为方式可能并不总是正确的。请注意,我在这里并不暗示从心理物理学的角度来看插值方案的任何适用性,这涉及大脑的处理(例如,参见Lanczos 重采样)。我严格地说,当人们试图“猜测”客观缺失的值时,插值施加的约束。
没有通用的“最佳方法”,它在很大程度上取决于您面临的插值问题。
我希望这有帮助。
PS(两种近似方法产生的伪影也不同,例如参见Gibbs Phenomenon and overfitting,尽管过度拟合是您问题的“另一面”。)
很好的问题和启发性的答案。我想分享以下几点见解。存在正交多项式基,例如勒让德多项式基(与单项基相反),它们在拟合更高次多项式时更稳定。由于香农插值公式中使用的 sinc 基(实际上也可以看作是卷积运算,因此也可以看作是滤波运算)是带限希尔伯特空间的正交基,因此正交多项式基可以用于逼近不在带限范围内的更大类别的函数空间以及与它们具有正交性的力量。
自 1960 年以来,多项式过滤(不是插值)也出现在化学文献中。R.Schafer 写了一篇关于重新审视这个主题的好讲稿,标题为,什么是 Savitzky-Golay 过滤器,链接:http://www-inst。 eecs.berkeley.edu/~ee123/fa12/docs/SGFilter.pdf