VOIP 的音频 - 过滤和重新采样,反之亦然?

信息处理 过滤器 声音的 声音
2022-01-28 07:06:02

我是信号处理的菜鸟,但我需要为 Asterisk VOIP 的 IVR 创建一些音频文件。

所以我的女朋友声音很好,在一台 Windows 机器上记录了她的信息,然后给我发了一个 44KHz、立体声 32 位 wav 文件。

我目前将其压缩为适用于 Linux 的 8KHz、单声道、16 位签名 wav 文件,然后将 wav 转换为 alaw 或 ulaw PCM 格式。

此过程的一个信息来源是此链接

我可以用 Audacity 做一些魔术:

  1. 立体声转单声道
  2. 使用“voip”或“电话”过滤器进行均衡:丢弃超过 3KHz 和低于 300Hz 的任何内容。
  3. 将音量/电平压缩到 -12 到 -15 dB
  4. 重采样 44 -> 8KHz
  5. 导出为 16 位签名 PCM wav
  6. 将其移至 Linux 并将其转换为alaw或 ulaw

结果是可以接受的,但我觉得它可以改进。特别是在重新采样后,声音听起来很闷。

这个顺序正确吗?

你有什么建议可以得到更好的结果吗?

3个回答

你的订单很好。我最大的问题是,

  1. 使用“voip”或“电话”过滤器进行均衡:丢弃超过 3KHz 和低于 300Hz 的任何内容。

由于您在步骤 4 中重新采样到 8 kHz,因此您的采样频率已经小于 4 kHz,因此我看不到 3 kHz 限制中的意义。并且对您正在使用的 3 kHz 滤波一无所知,我想知道您在这一步中失去了多少清晰度。这对你来说很容易测试。

我相信与 alaw 相比,使用 ulaw 可以获得更好的质量但动态范围更小。除此之外,压缩(步骤 3)可能是下一个最重要的实验方面。

规则是您必须始终在采样前进行过滤。

无论您是对模拟信号进行滤波然后采样,还是对数字信号进行滤波然后重新采样,该规则都适用。

您的过滤器必须以采样率的一半截断。

为什么你的内容被淹没了?我猜想允许对语音进行定义的高频内容数量不足。

您不必压缩音频信号。检查您的麦克风电平并进行调整,以使信号不会在 0dB 处出现削波。任何现代 Windows 机器的电平表都会在发生这种情况时显示。声音低沉的原因是过滤器需要作为重新采样过程的一部分进行。这是因为过滤器用作插值器,它将选择保留哪些样本并丢弃其余样本。向下重采样时还需要低通滤波器,以防止混叠。不知道事先通过乐队是否会这样做。我会将高频设置为 8 kHz 以保持频率范围。奈奎斯特理论指出,必须以最高频率的两倍以上对声音进行采样才能保留信号。希望这些建议能改善您的结果。

                               Regards, 

                                 thomasjonkeratyahoodotcom