信息处理 - VOIP 的音频 - 过滤和重新采样，反之亦然？ - 吾爱随笔录

VOIP 的音频 - 过滤和重新采样，反之亦然？

信息处理过滤器声音的声音

2022-01-28 07:06:02

我是信号处理的菜鸟，但我需要为 Asterisk VOIP 的 IVR 创建一些音频文件。

所以我的女朋友声音很好，在一台 Windows 机器上记录了她的信息，然后给我发了一个 44KHz、立体声 32 位 wav 文件。

我目前将其压缩为适用于 Linux 的 8KHz、单声道、16 位签名 wav 文件，然后将 wav 转换为 alaw 或 ulaw PCM 格式。

此过程的一个信息来源是此链接。

我可以用 Audacity 做一些魔术：

立体声转单声道
使用“voip”或“电话”过滤器进行均衡：丢弃超过 3KHz 和低于 300Hz 的任何内容。
将音量/电平压缩到 -12 到 -15 dB
重采样 44 -> 8KHz
导出为 16 位签名 PCM wav
将其移至 Linux 并将其转换为alaw或 ulaw

结果是可以接受的，但我觉得它可以改进。特别是在重新采样后，声音听起来很闷。

这个顺序正确吗？

你有什么建议可以得到更好的结果吗？

3个回答

你的订单很好。我最大的问题是，

使用“voip”或“电话”过滤器进行均衡：丢弃超过 3KHz 和低于 300Hz 的任何内容。

由于您在步骤 4 中重新采样到 8 kHz，因此您的采样频率已经小于 4 kHz，因此我看不到 3 kHz 限制中的意义。并且对您正在使用的 3 kHz 滤波一无所知，我想知道您在这一步中失去了多少清晰度。这对你来说很容易测试。

我相信与 alaw 相比，使用 ulaw 可以获得更好的质量但动态范围更小。除此之外，压缩（步骤 3）可能是下一个最重要的实验方面。

规则是您必须始终在采样前进行过滤。

无论您是对模拟信号进行滤波然后采样，还是对数字信号进行滤波然后重新采样，该规则都适用。

您的过滤器必须以采样率的一半截断。

为什么你的内容被淹没了？我猜想允许对语音进行定义的高频内容数量不足。

您不必压缩音频信号。检查您的麦克风电平并进行调整，以使信号不会在 0dB 处出现削波。任何现代 Windows 机器的电平表都会在发生这种情况时显示。声音低沉的原因是过滤器需要作为重新采样过程的一部分进行。这是因为过滤器用作插值器，它将选择保留哪些样本并丢弃其余样本。向下重采样时还需要低通滤波器，以防止混叠。不知道事先通过乐队是否会这样做。我会将高频设置为 8 kHz 以保持频率范围。奈奎斯特理论指出，必须以最高频率的两倍以上对声音进行采样才能保留信号。希望这些建议能改善您的结果。

                               Regards, 

                                 thomasjonkeratyahoodotcom

其它你可能感兴趣的问题

上一篇如何平滑估计的速度下一篇重采样：将多少样本归零或下采样？