恒定Q变换和小波变换有什么区别,哪个更好

信息处理 小波 转变
2021-12-30 10:06:16

我一直在寻找比 STFT 更好的变换,具有高重叠。Transform 应该更适合人类的听觉系统。

我了解到,我可以使用至少 3 种方法,例如 MFCC、CQT 和 CWT。忽略 MFCC 并考虑 CQT 和 CWT,我有一些论文和论文,但不能真正说出哪个更好。我红色的一些论文说CWT只是CQT的特例,CQT更好。其他人说CQT是CWT的特例。(像这里的这个问题:CQT 和 WT 之间的区别)一些论文说 CQT 是不可逆的,因为有些样本永远不会被分析

所以我现在很困惑,CQT和CWT有什么区别?如果我需要时间和频谱分析,哪个更好?如果我正在为语音和音乐分析寻求良好的转换,那么哪种转换最适合我?

还有一个愚蠢的问题:这些变换是否需要重叠才能获得更好的结果?

1个回答

恒定 Q 变换是 DFT 的一种变体。换句话说,它是一种小波变换。

我自己对这两种类型的转换只有一个随意的理解,所以请对我所说的持保留态度。

标准 DFT 在所有频率上使用恒定的窗口大小。这通常会导致相当一致的、完全连续的变换。但是,当您在对数尺度上映射频率时,所有频率的恒定 bin 大小会导致一些问题。具体来说,低端的峰值非常宽(有时高达半个八度),缺乏任何细节。

这是模拟人类感知的一个问题,因为人类以对数尺度感知频率。

恒定 Q 变换试图通过增加低频的窗口大小来解决这个问题,并通过减小用于高频的窗口大小来减轻由此引起的一些计算压力。它在这方面非常有效,但有一些缺点。

恒定 Q 变换的计算复杂度仅略大于标准 DFT,但由于窗口大小随频率变化,因此无法将 FFT 的典型优化应用于恒定 Q 变换。

换句话说,恒定 Q 变换将在涉及低频和对数频率映射的情况下产生更好的结果,但使其实时运行非常困难,并且在远较高频率的细节略少。

PS如果我对此有任何错误,请纠正我。