从音频信号中提取特征的算法

信息处理 matlab 声音的 算法
2022-02-02 12:35:46

我正在尝试建立一个说话人识别模型,我知道第一步是从我的数据库中的音频信号中提取特征。我已经做了很多研究,但找不到如何进行此提取以及提取哪些特征。如何选择要提取的特征?算法是什么?有人可以指出我可以实现的算法或示例 matlab 代码吗?

2个回答

对于说话人识别,您可能应该从MFCC开始。

有一些库提供 MFCC 提取模块,例如YAAFEaubio (C/C++)、MIR 工具箱或 Dan Ellis 的实现(Matlab) - 当然语音识别框架(Sphinx、HTK)提供 MFCC 提取工具。

请参考链接。

https://ch.mathworks.com/matlabcentral/fileexchange/19236-some-basic-audio-features

它计算各种特征

  1. 能量熵标准差 (std)
  2. 信号能量标准平均值(平均)比
  3. 过零率标准
  4. 光谱滚降标准
  5. 光谱质心标准
  6. 平均比率的光谱通量标准