谁能告诉我一种计算语音信号“4 Hz 调制能量”的方法?
谢谢。
编辑
我得到了一些细节: 4 Hz 调制能量:语音在 4 Hz 音节率 [3] 附近有一个特征能量调制峰值。我们使用部分 MFCC 算法 [4] 将音频信号转换为 40 个感知通道。我们提取每个频段的能量,用中心频率为 4 Hz 的二阶滤波器对每个通道进行带通滤波,然后通过平方和平滑结果计算短期能量。我们通过帧中的总通道能量对每个通道的 4 Hz 能量进行归一化,并对所有通道的结果求和。与音乐相比,语音在 4Hz 时往往具有更多的调制能量。