开窗函数平方?

信息处理 声音的 窗函数
2022-01-30 02:54:08

阅读有关 WSOLA 的论文(Verhelst,Roelands)PDF

在第 2 页有一个“时间扭曲 STFT 的合成函数”,其中涉及,它是一个窗口函数。一个开窗函数的平方v(n)=w2(n)

开窗函数平方的解释/含义是什么?
视觉上是什么意思?

4个回答

正如@robert bristow-johnson 所说,方形窗口是另一个窗口。如果您采用非常标准的类型,对称的,单峰的,正的(与相关问题Conditions for symmetric and unimodal windows in both time and frequency domain)并在处达到峰值,例如汉明窗口,您可以看到以下行为:1

汉明和平方汉明窗

由于中的收缩效应(换句话说,),平方低于原始值,同时保持相同的最大位置。所以窗口更好地定位,并且在末端得到改进的变迹,这对于减少重叠帧边缘的“阻塞”伪影很有用:如果原始窗口结束于,其平方版本结束于 ,一个十倍数减少。tt2[0,1]t2t0.10.01

另一个影响是新窗口接近能量归一化。即使您的“窗口”是零均值(如小波),其平方的能量也永远不会为零(除非窗口为零),因此您可以将其用作形状的加权平均值(类似于等式 4 ):

a2(k).x(k)a2(k).

这只是另一个窗口。通常这种情况发生在对进入STFT(这是 DFT)的时域数据应用窗口时,在 STFT 之后的频域数据发生一些过程,然后有一个逆 DFT 将其带回时间域,并且窗口再次应用于该输出时域数据。如果对频域中的数据执行的该过程恰好是过程,那么从 iDFT 出来的正是进入 DFT 的。那么,在这种情况下,窗口被应用两次,这与应用窗口的正方形一次相同。

我一直在与comp.dsp上的某个人就这个问题发生争执。有一个我以前从未见过的术语(“Princen-Bradley 条件”),我认为它与“互补功率”窗口的含义相同。如果将互补功率窗口的平方应用于上述具有处理的 STFT 系统,则当使用 50% 重叠时,输出将恰好是输入。但如果使用互补窗口的平方(例如 Hann),那么在 50% 的重叠情况下,您将无法获得完美的重建。所以 Hann 窗的平方根是互补幂窗的一个很好的候选。并且您必须将该窗口两次应用于时域数据才能获得完美的重建。

添加到Laurent的答案。我已经绘制了两个窗口的 F​​FT 的大小。我已将 FFT 填充为 1024,并且该图以 dB 为单位显示。这是一个常规的情节: 频域中的窗口

这是一个放大的版本: 频域中的 Windows 版本 2

窗口平方的效果在频域更为明显。因为更多的窗口系数更接近于零,所以相干增益有损失。主瓣变宽,因为时间上的乘法对应于频域中的卷积,这往往会扩展响应。旁瓣较低且衰减较快 - 旁瓣衰减率与时域窗口的连续导数数量渐近成正比 - 参见 Papoulis -“傅里叶积分及其应用”。

这意味着在 STFT 之前和 ISTFT 之后都应用了 w(n)。

w(n) 既是分析窗口又是综合窗口。 https://www.dsprelated.com/freebooks/sasp/Weighted_Overlap_Add.html

通常 w(n) 将被选为 COLA 窗口的平方根,因此当平方和重叠时,它总和为单位并准确地再现原始信号而没有波纹:https ://www.dsprelated.com/freebooks /sasp/COLA_Examples.html