MFCC特征提取

信息处理 fft mfcc
2022-01-05 00:19:32

我有一段音频,我已经对其进行了 FFT。现在我想做的是将此 FFT 转换为一组 MFCC,但是虽然我知道我需要根据一组 f 三角滤波器对 FFT 样本进行加权,但我并没有真正了解这涉及到什么。

任何人都可以详细介绍它吗?如果您要给我一个 matlab 示例,请解释好每个步骤,因为 matlab 允许您走很多弯路,我正在尝试在 iPhone 上实现 MFCC 提取。

1个回答

网上有很多关于 MFCC 的文献,所以如果您能更具体地说明您不了解处理的哪一部分,那会更容易一些。但是我将概述需要做什么,希望这对您有所帮助:

  1. 计算 FFT 箱的平方幅度
  2. 使用三角窗称量箱子;通常选择窗口使得三角形的中心在梅尔频率尺度上是等距的,并且使得每个三角形开始和结束于两个相邻三角形的中心。梅尔频率标度由 定义,其中是以 Hz 为单位的频率。查看该图以了解它是如何工作的: 请注意,内核被归一化,使得每个三角形的权重之和等于 1。通常使用大约 20 个这样的三角形窗口。
    m=2595log10(1+f/700)
    f在此处输入图像描述
  3. 取加权系数的对数。
  4. 计算 DCT。