滤波和多项式回归平滑之间的区别?


14

经典低通滤波(使用IIR或FIR)与通过局部N次多项式回归和/或插值(在上采样的情况下)“平滑”(特别是在N大于1的情况)之间有什么区别?但少于回归拟合中使用的局部点数。


+1好的问题,你击败了我。:-)使用N = 2的AFAIK对应于我们熟悉的线性“经典”过滤,但是对此我可能是错的。
太空

2
sinc重建与样条插值:cnx.org/content/m11126/latest “样条插值比sinc插值更平滑。这是因为主要样条的支持比sinc函数更紧凑。”
endolith

Answers:


10

低通滤波和多项式回归平滑都可以看作是函数的近似值。但是,执行此操作的方法不同。这里要问的关键问题是“您可以在另一个方面做一个吗?” 简短的回答是“并非总是”,原因如下。

当通过滤波进行平滑处理时,关键操作是卷积,其中,在频域中转换为其中表示离散傅立叶变换(而则为逆)。离散傅立叶变换(例如)提供的近似值,作为三角函数的总和。当是低通滤波器时,保留了较少数量的低频分量,并且的突变得以消除。通过使用三角函数作为基础函数,可以在函数逼近的情况下设置低通滤波y = F - 1F x F h F F - 1 F x x h x x n x h y n ÿñ=XñHñÿ=F-1个FXFHFF-1个FXXHX,但值得回顾一下卷积公式,请注意,在滤波时,y(n)(滤波器的输出)取决于以及过去样本的加权和(此处的权重由 “形状” )。(当然,对于IIR滤波器也有类似的考虑,当然也要加上的过去值)XñXHÿñ

但是,当通过某些n次多项式进行平滑处理时,插值的输出仅取决于和(不同)基函数(也称为单项式)的混合。这些不同的基函数是什么?它是一个常数(),一条线(),一个抛物线()等(请参考获得更好的说明)。通常,尽管如此,当及时处理等距样本并且出于准确性的原因,使用的是多项式的牛顿形式a 0 x 0 a 1 x a 2 x 2Xñ一种0X0一种1个X一种2X2。我之所以这样说,是因为通过它可以很容易地看出,在执行线性插值时,您可以构建一个滤波器内核,该滤波器内核返回可用样本的线性加权和,就像低阶插值多项式将使用“线”进行插值一样在两个样本之间。但是在较高的程度上,这两种近似方法将返回不同的结果(由于基函数的不同)。

如我上面所述,不严格考虑过去值并不严格。这是一个微妙的地方。因为通常在构建多项式时,不考虑给定间隔之外的值(信号的“过去”和“未来”)。但是,可以通过将导数固定在间隔的边缘来包括这些。如果重复执行此操作(如不重叠的滑动窗口),则有效地将考虑x(n)的“过去样本”。(这是样条曲线使用的技巧,实际上,存在三次立方插值的卷积表达式。但是,请注意,在讨论样条曲线时,的解释是不同的- 请注意有关归一化的要点-)XñX

有时使用过滤作为插值的原因(例如在“ Sinc插值”的情况下)是因为从物理角度来看它也是有意义的。时域中带限系统(例如,光学系统中的(线性)放大器或透镜)的理想表示是正弦脉冲。正弦脉冲的频域表示为矩形“脉冲”。因此,基于极少的假设,我们预计缺失值或多或少地接近其邻居(当然,在限制范围内)。如果这是使用某个n阶多项式(对于更高的n)执行的,则我们以一种“固定”的方式将缺失值与其邻居相关联,而这可能并不总是现实的(为什么a的声压值应该例如,将波前击中麦克风固定为具有的形状?它假设声源的行为可能并不总是正确的,请注意,我并不暗示插值的适用性从心理物理学的角度来看,该方案涉及大脑的处理(请参阅Lanczos重采样X3例如)。我严格地说,是当人们试图“猜测”客观缺失值时,插值所施加的约束。

没有通用的“最佳方法”,它在很大程度上取决于您面临的插值问题。

我希望这有帮助。

PS(由两种近似方法产生的伪像也不同,例如,参见吉布斯现象过度拟合,尽管过度拟合是问题的“另一端”。)


+1出色的答案。一些后续工作:1)您提到在多项式拟合中没有考虑x [n]的过去值,但是,这是否基于您对x [n]是正弦/余弦之和的说法是没有根据的呢?(无论是否考虑过去的值,仍然适用)。2)在这种情况下,我对某种物理意义上的“带宽受限”感到困惑。乐队的所有乐队都不都是吗?也就是说,会通过某些频率并衰减其他频率吗?无限制系统的物理示例是什么?谢谢。
太空

1)不确定我是否完全理解您的意思,但我指的是从卷积和多项式拟合获得输出之间的差异。2)在某些情况下,信号和系统在同一框架下处理。从理论上讲,存在不受带宽限制的信号(en.wikipedia.org/wiki/…),例如(真正的)白噪声(en.wikipedia.org/wiki/White_noise)。Oppenheim和Willsky的Signals&Systems提供了非常好的处理方法。我在这里使用术语来建立
bandlimit-

好的,我重写了我的问题-为了确保:1)我们使用的多项式越多,在强迫点之间的关系时我们越有“偏见”,这可能不符合物理现实,是吗?(在这种情况下,更多的并不总会更好。)2)关于频带限制-我只是好奇为什么这么说,因为每个系统频带都不受限制,因为它只吸收某些频率而衰减其他频率吗?谢谢。
太空

抱歉,这没有引起我的注意。对于这些特定问题:1)不必要。在给出的示例中,我指的是单项式“形状”所施加的限制。2)信号与系统会有所帮助。据说某些事情是精确的,因为工程应用程序使用数学的子集,而在另一领域中,数学子集可能对非带限信号有很好的用途(例如上面链接的真正统一的随机过程(白噪声))。
2012年

2

好问题和启发性的答案。我想分享一些见解,如下。也存在正交多项式基,例如勒让德的多项式基(与单项式基相反),在拟合更高次多项式时更稳定。由于在Shannon插值公式中使用的sinc基(实际上也可以看作是卷积运算,因此也可以看作是滤波运算)是带限Hilbert空间的正交基,所以正交多项式基可以用来近似不在带限中的更大一类函数空间以及与它们正交的能力。

自1960年以来,化学文献中就已经出现了多项式过滤(而非插值)。R.Schafer撰写了一篇很好的讲解该主题的讲义,标题为“什么是Savitzky-Golay过滤器”,链接:http:// www-inst。 eecs.berkeley.edu/~ee123/fa12/docs/SGFilter.pdf

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.