具有不同窗口长度的 STFT(如连续小波变换)

信息处理 fft 频谱图 stft 英担
2022-02-13 23:37:27

我想知道在基于短时傅里叶变换 (STFT) 制作频谱图时是否可以使用不同长度的窗口。也就是说,对于更高的频率,我会使用更短的窗口,以便以较差的光谱分辨率为代价获得更高的时间分辨率。我知道这种方法会导致时间和频率分辨率之间的权衡,就像在连续小波变换中一样,以及更高的计算复杂度。

我想问一下,当以这种方式使用 STFT 时,除了上面提到的那些缺点之外,是否还有其他缺点,因为我找不到任何关于它的文献。

非常感谢你。

2个回答

这有时在创建对数频率缩放频谱图时完成(这可能更好地匹配人类时间与音高感知)。

使用多种尺寸的 STFT 的一个问题是,这会导致同一图形绘图点(频率与时间)的多个 FFT 输出。因此,您必须决定如何在不添加(更多)视觉条带伪影的情况下,以及在频域和时域中选择、缩放、混合、插值和/或交叉淡化重叠的 FFT 信息,其中分辨率差异问题可以是正交的。

简化一点,

  • 具有不同分辨率的 CWT <-> STFT
  • 具有固定分辨率的 STFT <-> CWT

这是两个转换之间唯一的定义差异(仍然导致非常不同的属性)。更全面地说,CWT 将以指数方式分布窗口长度(并且生成的内核是可接受的),但您可以使用另一种分布(例如线性)。这不一定会带来更大的计算复杂性;CWT 可以使用按列 FFT 实现,并且具有hop_length.

缺点:

  1. 失去可逆性 -> 失去信息。可能取决于窗口和宽度选择。
  2. 更难的可逆性;即使可能,也可能不清楚如何去做。一些方法依赖于完全可逆性(例如独立模式提取、时频重新分配)。
  3. 降低的特征质量/更难的设计:CWT 原子被设计为在时频支持方面有所不同。STFT 原子针对单一权衡进行了优化。在改变分辨率时,变换冗余、分析性和边界效应等因素可以更好地控制前者。可以改为使用 CWT 小波并例如线性地改变其分辨率)。
  4. 有限的灵活性:窗口不能实现小波可以实现的所有行为。“窗口化”是单频复数正弦曲线的缩放;这提供了一个独特的中心频率。中心频率至少有三个不同的概念,每个都可以被小波利用(快速示例)。注意窗口不能产生真正的小波(对于快速瞬态检测、分形分析很有用)。

还值得研究两者的推广,即非平稳 Gabor 变换(NSGT)。