我正在尝试在电话语音音频上训练机器学习算法。但是,我能找到的任何地方都没有足够的数据。我的解决方案是只使用 Youtube 视频中的语音音频。如何将 Youtube 视频中的音频转换为模拟电话音频的音频?
将语音音频转换为电话音频
信息处理
声音的
语音处理
机器学习
演讲
视频
2022-02-03 13:02:47
2个回答
截止频率为 300 Hz 和 3400 Hz 的带通滤波应该会产生良好的近似值。尝试使用 Chebychev 过滤器或订购不超过 6 个。
然后您可能需要将音频下采样到每秒 8000 个样本,这是电话的标准。
PS 实际的截止频率(尤其是 3400 Hz)可能会根据不同的来源而有所不同。当我找到国际电联官方推荐时,我会编辑这个答案。
我曾经使用两部手机并通过拨打和实际通话来做到这一点。主叫电话有一个质量很好的耳机推在它的麦克风上,音频是通过耳机播放的。音频是从接收电话的耳机输出连接器录制的。缺点是如果有人想稍后重复实验,以下内容可能难以复制:
- 耳机相对于主叫电话的位置
- 调整耳机音量控制
- 电话的选择(影响麦克风声学、麦克风选择以及内部滤波和增益控制等)
- 通话电话的状况(灰尘/污垢可能会影响麦克风)
- 电话网络
您可以在此处从 4:38 开始听到男声的结果。这是我们在 2011 年使用的基本 GSM 网络和随机电话。
或者,您可以尝试在 Audacity 中将音频文件导出为GSM 6.10 WAV。
其它你可能感兴趣的问题