对于 12 岁的孩子来说,倒谱的直观解释是什么?

信息处理 倒谱分析
2022-02-06 15:20:50

本着费曼的“如果你真正理解一个概念,你应该能够解释清楚”的精神,解释应该是有道理的。

有两个主要挑战:

  1. “Quefrency”的轴不是一个简单/自然的概念,如何描述和理解它是什么?

  2. 为什么倒谱视图是“提升”信号中包含的主要信息的有效方式?我们可以看到vector更简洁了,但是这个效率是从哪里来的呢?

1个回答

“效率”来自先验假设。使倒谱有用的一个假设是信号包含大致周期性的东西,包括一组谐波或泛音,可能在某种频谱包络内。

所以倒谱大多只是 FFT 的 FFT。有几个模组。On mod 是在第一次 FFT 之后取对数幅度,以防止大泛音淹没小泛音。

因此,DFT(慢 FFT)将周期性事件与一些正弦基向量相关联。除非周期性时域事件是单个纯正弦曲线,否则这些周期性事件通常会与多个等间隔的泛音频率 DFT 基向量很好地相关。

因此,您最终会从开始的地方结束,发生了一堆大致等距的事件,但现在是在频域而不是时域中。第二个 FFT 将再次将这些与与该频谱周期性相关的正弦基向量相关联,这对于音频信号来说是(泛音丰富)音高的有趣代理。频谱包络,因为它被强制为正(通过对数幅度),最终围绕 DC,而不是像时域调制那样成为频谱峰值的边带。这有助于将包络信息(共振峰等)与倒谱结果中的音高信息分开。

倒谱也适用于单个纯正弦曲线,因为两条谱线(正和负频率峰值)与与线分离宽度相同的负余弦相关。

注意一个必要的技巧:通常必须在对数之前使零和微小的 FFT 频谱幅度更大,以避免对数产生巨大的负尖峰或 NaN。