将音频信号分成段并分析每个段的目的是什么?

信息处理 fft 信号分析 自由度 音频处理 特征提取
2022-01-31 12:05:38

我读了一堆从音频信号中提取特征的材料,他们都告诉我要把信号分成几段,我们为什么不分析所有的音频信号呢?我不知道这样做有什么好处以及细分应该有多宽?我只看到每帧 256 个样本或每帧 512 个样本……每帧 1028 个呢?

1个回答

使用适当的窗口分析每个段的信号是处理音频样本中非平稳的一种方法。通过全尺寸分析,功能可能会混合在一起。因此,分段分割在许多算法(mp3、shazam)中发挥作用。

窗口的长度通常是数据信息和计算优势之间的权衡问题:

  • 信号采样(没有采样率的情况下,窗口长度毫无意义),关于以下内容:
  • 分析或从信号中提取信息内容:数据中可能存在各种平稳性范围,或通常有用的处理特征,
  • 易于计算:您提到的二次幂长度可能是有益的(更快的算法,如 FFT 中的算法)、并行计算、专用硬件,更接近实时分析。