为什么激发信号在倒谱中以高频率出现、分离?

信息处理 语音识别 演讲 语音 倒谱分析
2021-12-28 03:42:37

因此,我刚刚开始了语音和语言处理课程,并且发现对获取信号倒谱及其属性的过程的解释有点混乱。以下是对我目前的理解的描述以及对它给我造成的困惑的解释:

  1. 从语音信号开始。我们可以将其视为共振峰信号与激励信号的卷积,该激励信号是狄拉克梳(近似)。
  2. 取 FFT,得到激发谱乘以共振峰谱。激励信号的 FFT 是另一个狄拉克梳,周期为 1/T
  3. 记录日志。所以现在添加了上面的 2 个信号
  4. 逆傅立叶变换 - 现在应该将来自 1 的两个信号相加(FT 变换是线性的)

那么如果这 4 个步骤是正确的,那么为什么激发会出现在频率域的特定区域?它应该以狄拉克梳的形式出现,添加到共振峰脉冲响应中,不是吗?

3个回答

当使用 FFT 时,一个域中均匀间隔的事件序列通常会在另一个域中与第一个域中的事件间隔相关的位置产生强分量。

浊音信号通常包含大量在频域中均匀分布的谐波。因此,频域中这些均匀间隔的事件将在频域中产生一个分量,该分量的位置与谐波的间隔有关。并且频域中谐波的间隔与时域中励磁事件的间隔(基波周期)有关。

根据您的描述,对数操作似乎会产生缩小不同频率幅度范围的效果。通过对数(FFT)的 IFFT 生成倒谱应该会产生更清晰的信号。您可以尝试使用不同的对数基数和 nth 根来了解效果。

在语音产生的源滤波器模型中,滤波器(共振峰)在频域中非常平滑——它只是一堆相对较大的频带凸起。因此,在频率域中,它的能量主要分布在少数较低的倒谱系数上。