我知道功率谱密度的傅里叶逆变换给出自相关序列(由 Wiener-Khinchin 定理):
如果我们更换通过它的对数值,我们得到倒谱序列:
我的问题是:
- 使用对数值的原因是什么?
- 为什么会有所不同?
- 为什么在 MFCC、LPCC、PLPCC 等中不使用自相关序列而不是倒谱?
我知道功率谱密度的傅里叶逆变换给出自相关序列(由 Wiener-Khinchin 定理):
如果我们更换通过它的对数值,我们得到倒谱序列:
我的问题是:
通常在语音信号处理中使用倒谱来表示低频和高频分量,它们相互相乘(在时域中,它是一个缓慢变化的信号与高频信号卷积)。
使用对数值的原因是什么?
取对数以消除乘法效应并将其转换为两个分量的加法。
为什么会有所不同?
现在这两个组件是相加形式的。
为什么在 MFCC、LPCC、PLPCC 等中不使用自相关序列而不是倒谱?
同样的原因,因为我们需要去除慢变分量和快变分量的乘法效应。
在语音信号处理中,缓慢变化的分量代表不同的音素,因此充当许多应用程序(例如 ASR)的特征向量。因此,我们需要去除快速变化分量的影响,以隔离慢速变化分量。