将语音音频转换为电话音频

信息处理 声音的 语音处理 机器学习 演讲 视频
2022-02-03 13:02:47

我正在尝试在电话语音音频上训练机器学习算法。但是,我能找到的任何地方都没有足够的数据。我的解决方案是只使用 Youtube 视频中的语音音频。如何将 Youtube 视频中的音频转换为模拟电话音频的音频?

2个回答

截止频率为 300 Hz 和 3400 Hz 的带通滤波应该会产生良好的近似值。尝试使用 Chebychev 过滤器或订购不超过 6 个。

然后您可能需要将音频下采样到每秒 8000 个样本,这是电话的标准。

PS 实际的截止频率(尤其是 3400 Hz)可能会根据不同的来源而有所不同。当我找到国际电联官方推荐时,我会编辑这个答案。

我曾经使用两部手机并通过拨打和实际通话来做到这一点。主叫电话有一个质量很好的耳机推在它的麦克风上,音频是通过耳机播放的。音频是从接收电话的耳机输出连接器录制的。缺点是如果有人想稍后重复实验,以下内容可能难以复制:

  • 耳机相对于主叫电话的位置
  • 调整耳机音量控制
  • 电话的选择(影响麦克风声学、麦克风选择以及内部滤波和增益控制等)
  • 通话电话的状况(灰尘/污垢可能会影响麦克风)
  • 电话网络

您可以在此处从 4:38 开始听到男声的结果这是我们在 2011 年使用的基本 GSM 网络和随机电话。

或者,您可以尝试在 Audacity 中将音频文件导出为GSM 6.10 WAV