信息处理 - 将语音音频转换为电话音频 - 吾爱随笔录

信息处理声音的语音处理机器学习演讲视频

2022-02-03 13:02:47

我正在尝试在电话语音音频上训练机器学习算法。但是，我能找到的任何地方都没有足够的数据。我的解决方案是只使用 Youtube 视频中的语音音频。如何将 Youtube 视频中的音频转换为模拟电话音频的音频？

2个回答

截止频率为 300 Hz 和 3400 Hz 的带通滤波应该会产生良好的近似值。尝试使用 Chebychev 过滤器或订购不超过 6 个。

然后您可能需要将音频下采样到每秒 8000 个样本，这是电话的标准。

PS 实际的截止频率（尤其是 3400 Hz）可能会根据不同的来源而有所不同。当我找到国际电联官方推荐时，我会编辑这个答案。

我曾经使用两部手机并通过拨打和实际通话来做到这一点。主叫电话有一个质量很好的耳机推在它的麦克风上，音频是通过耳机播放的。音频是从接收电话的耳机输出连接器录制的。缺点是如果有人想稍后重复实验，以下内容可能难以复制：

您可以在此处从 4:38 开始听到男声的结果。这是我们在 2011 年使用的基本 GSM 网络和随机电话。

或者，您可以尝试在 Audacity 中将音频文件导出为GSM 6.10 WAV。

其它你可能感兴趣的问题