因此,我刚刚开始了语音和语言处理课程,并且发现对获取信号倒谱及其属性的过程的解释有点混乱。以下是对我目前的理解的描述以及对它给我造成的困惑的解释:
- 从语音信号开始。我们可以将其视为共振峰信号与激励信号的卷积,该激励信号是狄拉克梳(近似)。
- 取 FFT,得到激发谱乘以共振峰谱。激励信号的 FFT 是另一个狄拉克梳,周期为 1/T
- 记录日志。所以现在添加了上面的 2 个信号
- 逆傅立叶变换 - 现在应该将来自 1 的两个信号相加(FT 变换是线性的)
那么如果这 4 个步骤是正确的,那么为什么激发会出现在频率域的特定区域?它应该以狄拉克梳的形式出现,添加到共振峰脉冲响应中,不是吗?