阅读有关 WSOLA 的论文(Verhelst,Roelands)(PDF)
在第 2 页有一个“时间扭曲 STFT 的合成函数”,其中涉及,它是一个窗口函数。一个开窗函数的平方。
开窗函数平方的解释/含义是什么?
视觉上是什么意思?
阅读有关 WSOLA 的论文(Verhelst,Roelands)(PDF)
在第 2 页有一个“时间扭曲 STFT 的合成函数”,其中涉及,它是一个窗口函数。一个开窗函数的平方。
开窗函数平方的解释/含义是什么?
视觉上是什么意思?
正如@robert bristow-johnson 所说,方形窗口是另一个窗口。如果您采用非常标准的类型,对称的,单峰的,正的(与相关问题Conditions for symmetric and unimodal windows in both time and frequency domain)并在处达到峰值,例如汉明窗口,您可以看到以下行为:
由于在中的收缩效应(换句话说,),平方低于原始值,同时保持相同的最大位置。所以窗口更好地定位,并且在末端得到改进的变迹,这对于减少重叠帧边缘的“阻塞”伪影很有用:如果原始窗口结束于,其平方版本结束于 ,一个十倍数减少。
另一个影响是新窗口接近能量归一化。即使您的“窗口”是零均值(如小波),其平方的能量也永远不会为零(除非窗口为零),因此您可以将其用作形状的加权平均值(类似于等式 4 ):
这只是另一个窗口。通常这种情况发生在对进入STFT(这是 DFT)的时域数据应用窗口时,在 STFT 之后的频域数据发生一些过程,然后有一个逆 DFT 将其带回时间域,并且窗口再次应用于该输出时域数据。如果对频域中的数据执行的该过程恰好是空过程,那么从 iDFT 出来的正是进入 DFT 的。那么,在这种情况下,窗口被应用两次,这与应用窗口的正方形一次相同。
我一直在与comp.dsp上的某个人就这个问题发生争执。有一个我以前从未见过的术语(“Princen-Bradley 条件”),我认为它与“互补功率”窗口的含义相同。如果将互补功率窗口的平方应用于上述具有零处理的 STFT 系统,则当使用 50% 重叠时,输出将恰好是输入。但如果使用互补窗口的平方(例如 Hann),那么在 50% 的重叠情况下,您将无法获得完美的重建。所以 Hann 窗的平方根是互补幂窗的一个很好的候选。并且您必须将该窗口两次应用于时域数据才能获得完美的重建。
这意味着在 STFT 之前和 ISTFT 之后都应用了 w(n)。
w(n) 既是分析窗口又是综合窗口。 https://www.dsprelated.com/freebooks/sasp/Weighted_Overlap_Add.html
通常 w(n) 将被选为 COLA 窗口的平方根,因此当平方和重叠时,它总和为单位并准确地再现原始信号而没有波纹:https ://www.dsprelated.com/freebooks /sasp/COLA_Examples.html