信息处理 - 恒定Q变换和小波变换有什么区别，哪个更好 - 吾爱随笔录

恒定Q变换和小波变换有什么区别，哪个更好

信息处理小波转变

2021-12-30 10:06:16

我一直在寻找比 STFT 更好的变换，具有高重叠。Transform 应该更适合人类的听觉系统。

我了解到，我可以使用至少 3 种方法，例如 MFCC、CQT 和 CWT。忽略 MFCC 并考虑 CQT 和 CWT，我有一些论文和论文，但不能真正说出哪个更好。我红色的一些论文说CWT只是CQT的特例，CQT更好。其他人说CQT是CWT的特例。（像这里的这个问题：CQT 和 WT 之间的区别）一些论文说 CQT 是不可逆的，因为有些样本永远不会被分析

所以我现在很困惑，CQT和CWT有什么区别？如果我需要时间和频谱分析，哪个更好？如果我正在为语音和音乐分析寻求良好的转换，那么哪种转换最适合我？

还有一个愚蠢的问题：这些变换是否需要重叠才能获得更好的结果？

1个回答

恒定 Q 变换是 DFT 的一种变体。换句话说，它是一种小波变换。

我自己对这两种类型的转换只有一个随意的理解，所以请对我所说的持保留态度。

标准 DFT 在所有频率上使用恒定的窗口大小。这通常会导致相当一致的、完全连续的变换。但是，当您在对数尺度上映射频率时，所有频率的恒定 bin 大小会导致一些问题。具体来说，低端的峰值非常宽（有时高达半个八度），缺乏任何细节。

这是模拟人类感知的一个问题，因为人类以对数尺度感知频率。

恒定 Q 变换试图通过增加低频的窗口大小来解决这个问题，并通过减小用于高频的窗口大小来减轻由此引起的一些计算压力。它在这方面非常有效，但有一些缺点。

恒定 Q 变换的计算复杂度仅略大于标准 DFT，但由于窗口大小随频率变化，因此无法将 FFT 的典型优化应用于恒定 Q 变换。

换句话说，恒定 Q 变换将在涉及低频和对数频率映射的情况下产生更好的结果，但使其实时运行非常困难，并且在远较高频率的细节略少。

PS如果我对此有任何错误，请纠正我。

其它你可能感兴趣的问题

上一篇需要更好的步数检测算法下一篇使用 Python 进行信号过滤