AMR 文件结构问题

信息处理 声音的
2022-02-15 23:15:10

为了开发应用程序,我必须确定一个声音区域。但是我不确定我的基本知识是否正确。我正在使用 AMR-NB 声音片段来识别声音区域。据我了解,AMR 文件每 20 毫秒(毫秒)有 160 个样本,因此 1 分钟有 800 个样本。我完全依赖这个概念。请让我知道这是否正确,如果不正确,请纠正我。提前致谢。

1个回答

实际上,如果它每 20 毫秒有 160 个样本,那么您将获得 8000 的采样率(您缺少一个零),这是电话语音通信的标准。从 Google 搜索中,我找不到任何使用不同采样率的 AMR-NB 规范。

另外,我发现这里的这一行非常有用:

对于 AMR-NB,只有“8000”采样率和以下比特率之一有效:4.75k、5.15k、5.9k、6.7k、7.4k、7.95k、10.2k 或 12.2k

Wikipedia还提到 AMR-NB 使用 8000 Hz 的采样率,你可以很确定这一切都是如此。