获得“4 Hz 调制能量”

信息处理 matlab 调制
2022-02-02 03:10:34

谁能告诉我一种计算语音信号“4 Hz 调制能量”的方法?

谢谢。

编辑

我得到了一些细节: 4 Hz 调制能量:语音在 4 Hz 音节率 [3] 附近有一个特征能量调制峰值。我们使用部分 MFCC 算法 [4] 将音频信号转换为 40 个感知通道。我们提取每个频段的能量,用中心频率为 4 Hz 的二阶滤波器对每个通道进行带通滤波,然后通过平方和平滑结果计算短期能量。我们通过帧中的总通道能量对每个通道的 4 Hz 能量进行归一化,并对所有通道的结果求和。与音乐相比,语音在 4Hz 时往往具有更多的调制能量。

1个回答

我评论中的链接建议如下:

我建议首先使用半波整流(即,用零替换时间波形中的所有负值)或希尔伯特变换来提取包络,然后在 50 Hz 左右对波形进行低通滤波(如果你只选择低通关心 4 Hz 分量)。一旦你有了包络,只需做一个 fft(确保你的频率分辨率至少为 1 Hz)并寻找 4 Hz 左右的能量。如果您觉得这些步骤中的任何一个都不明显,请告诉我,我可以给您发送一些 Matlab 代码。

所以,这意味着你需要发表你的演讲s[n]并找到信封:

e[n]=|s[n]+jH[s[n]]|

在哪里H是语音信号的希尔伯特变换。

然后,进行 FFT 并查看 4Hz 的 bin。