重建过滤器 - 它实际上是如何工作的?

信息处理 奈奎斯特 重建 数模
2021-12-30 15:48:15

我正在尝试对围绕使用 192kHz 作为播放采样率的宗教战争形成自己的理解(互联网似乎在双方都有丰富的资料)。我正在努力了解重建过滤器的工作原理。

反 192 阵营经常引用Nyquist-Shannon 采样定理基本上指出,44.1kHz 的采样率足以在不损失 20kHz 的带限信号的情况下重建。然而,当查看Whittaker-Shannon 插值公式时,在我看来,理想的重建滤波器需要能够访问所有样本,即所有过去和所有未来样本。

我不是模拟音频方面的专家,但我怀疑能否制造出这样的设备。我会假设,充其量可以引入延迟来“等待”足够的未来样本到达,以便不可用的未来样本对当前输出时刻的贡献变得可以忽略不计。

有人能解释一下实际的重建过滤器是如何工作的,它们的权衡是什么吗?如果只有一个样本窗口可用或重建延迟不可接受,那么 Nyquist-Shannon 定理是否存在理论上更严格的限制?

4个回答

采样定理需要一个完美的带限信号,带限低于采样频率的两倍。这样做的问题是,只有无限长的信号(例如在大爆炸之前存在)可以被完美地限制带宽。这来自傅里叶定理,关于任何具有有限支持的域。

因此,所有真实世界的信号都受到不完善的频带限制,受记录会话的长度和采样前使用的低通滤波的脉冲响应持续时间的限制(例如,不完善的频带限制)。因此,由于样本混叠,您必须假设一个有限的本底噪声。因此,您的重建也不需要比这个本底噪声更好。因此,您可以将完美的重建公式窗口化到一些合理的有限持续时间。对于音频,这个窗口宽度可以限制在最低频率可听周期的一小部分,因为之前和之后的东西不会显着影响可听音高感知(其他东西,如掩蔽和自适应阈值等,可能占主导地位)。

非常高的采样率的优点是混叠频率(由于不完美的预采样滤波和采样后重建)甚至更高,并且不太可能被物理麦克风拾取或以任何显着幅度(高于热噪声基底等)通过抗混叠滤波器。正如此处详细说明的其他答案一样,这还允许物理上可实现的滤波器更平坦,并在通用 20-20k 通带中具有更多线性相位响应,并且滚降更接近采样率的一半。

一个快速的答案,但由于人类的听力不会超过 20kHz 带宽,因此 44.1kHz 足以存储和传输音频。问题是 ADC 之前的模拟抗混叠滤波器必须非常锐利,才能通过足够的 20 kHz 并足够阻止 22.05 kHz,这只是需要许多具有良好性能和容差的组件。当以 192 kHz 等更高速率进行采样时,模拟滤波器可以更简单、更便宜,因为它具有更宽的过渡带,它需要通过 20 kHz 并在 96 kHz 处阻塞。速率转换和低通滤波可以数字化进行,以实现锐截止而不会出现混叠。播放音频时也是如此,将信号上采样并以数字方式重建到 192 kHz 进行播放,DAC 输出模拟滤波器既便宜又简单。重建滤波器只需要足够好,在 20kHz 音频带宽之后没有太多的混叠频谱图像,而模拟滤波器会去除 DAC 速率的实际频谱图像。因此,在 ADC 和 DAC 上使用更高的速率是有意义的,并且也许可以控制音频,但传输和存储只有狗和蝙蝠才能听到的频率只会花费更多,更不用说能够产生它们的设备(放大器、扬声器)了没有问题。所以基本上每个数字样本只是一个无限窄的脉冲,并且以采样率重复的脉冲会产生频谱图像,必须通过重建滤波器过滤掉这些图像,从而使预期的基带信号保持完整。因此,在 ADC 和 DAC 上使用更高的速率是有意义的,并且也许可以控制音频,但传输和存储只有狗和蝙蝠才能听到的频率只会花费更多,更不用说能够产生它们的设备(放大器、扬声器)了没有问题。所以基本上每个数字样本只是一个无限窄的脉冲,并且以采样率重复的脉冲会产生频谱图像,必须通过重建滤波器过滤掉这些图像,从而使预期的基带信号保持完整。因此,在 ADC 和 DAC 上使用更高的速率是有意义的,并且也许可以控制音频,但传输和存储只有狗和蝙蝠才能听到的频率只会花费更多,更不用说能够产生它们的设备(放大器、扬声器)了没有问题。所以基本上每个数字样本只是一个无限窄的脉冲,并且以采样率重复的脉冲会产生频谱图像,必须通过重建滤波器过滤掉这些图像,从而使预期的基带信号保持完整。

考虑到基本的音频应用,数模转换重建滤波器(又称插值滤波器)是一种低通模拟滤波器,它在输出到扬声器之前去除输出端的所有图像频谱,并仅保留滤波器通带中的基带频谱:在其低通滤波器的截止频率内。需要注意的是,扬声器本身也是重构低通滤波器特性的强项,理想的滤波器可以在合适的条件下充分放松。

理想情况下,应该根据数字信号的输入采样率来选择内插滤波器的这个通带(或截止频率)。如果原始信号在 44.1 kHz 下被充分采样而没有混叠,那么在正常条件下(假设系统内没有采样率转换),输出DAC 采样频率和相关的插值滤波器截止频率应选择为 44.1 kHz 和 22.05 kHz分别。

如果输入以 96 kHz 采样,则输出重建 DAC 频率应为 96 kHz,重建滤波器应具有 48 kHz 的截止频率,等等……注意,理论使用理想脉冲和理想滤波器来描述事物(正如我在上面所做的那样),但实用的 DAC 电路在输出端使用零阶保持和实用的滤波器。

请注意,如果输入和输出采样率不匹配,则播放速度将与录制速度不匹配。此外,如果您选择的截止频率低于必要的最小值(即输出 DAC 采样率的奈奎斯特频率),那么您将丢弃信号频谱。此外,如果您选择大于奈奎斯特频率的插值滤波器截止频率,那么您将在音频输出处出现图像失真。

只有一场关于数字音频的宗教战争是关于输入端的 96 kHz 采样率是否真的必要。共识(?)是,根据多次进行的经验测试,没有必要但无论如何,auidophiles 都可以自由选择他们最喜欢的采样率。

通过允许增加由数字过采样滤波器引入的延迟,可以将滤波器的其他特性、通带和阻带纹波以及过渡带宽改进为任意接近零。可以增加过采样因子以加宽阻带并放宽对模拟滤波的要求,从而导致计算复杂度增加,但滤波器引入的延迟时间不会显着增加。

音频 DAC 通常具有一个数字过采样滤波器,可在低延时(延迟)滤波器和尖锐频率响应滚降滤波器之间进行选择。低延迟滤波器可以是最小相位滤波器或低色散(一些频率比其他频率延迟更多)和低有效延迟之间的心理声学调谐折衷。急剧滚降滤波器通常是具有对称脉冲响应的线性相位滤波器,并且在通带和阻带中具有指定的最大纹波。这种规格很容易在数据表中表达并融入系统设计。可以在 Octave 中使用 设计类似的等波纹线性相位滤波器remez,这里通带和阻带波纹的权重相等:

pkg load signal
x2x = []; x4x = [];
for n = [16:86]
  b2x = remez(2*n, [0, 20/44.1, (44.1-20)/44.1, 1], [1, 1, 0, 0], [1, 1], "bandpass", 128);
  b4x = remez(2*n, [0, 20/(44.1*2), (44.1-20)/(44.1*2), 1], [1, 1, 0, 0], [1, 1], "bandpass", 128);
  [h2x, w2x] = freqz(b2x); [h4x, w4x] = freqz(b4x);
  x2x = [x2x; (length(b2x)-1)/2/2, 20*log10(abs(h2x(end)))];
  x4x = [x4x; (length(b4x)-1)/2/4, 20*log10(abs(h4x(end)))];
endfor
plot(x2x(:,1), x2x(:,2), "x", x4x(:,1), x4x(:,2), "x", 29.2, -100, "x", 39.5, -110, "x", 43.3828125, -110, "x")
xlabel("group delay / f_s");
ylabel("stop band ripple (dB)");
text(29.2-2, -100-4, "AK4499");
text(39.5-2, -110+4, "CS43198");
text(43.3828125-2, -110-4, "AD1955");
grid on

remez该脚本为从 0 到 20 kHz 的通带和从 24.1 kHz 开始的阻带设计了各种阶滤波器(受限于可以在没有数值问题的情况下处理的内容),以在 2 和 4 倍的过采样采样频率的小范围选择下运行44.1 kHz 采样频率,并绘制(图 1)阻带纹波特性以及 Asahi Kasei ( AK4499 )、Analog Devices ( AD1955 ) 和 Cirrus Logic ( CS43198 ) 的旗舰音频 DAC 的等效过采样数字滤波器的特性。

在此处输入图像描述
图 1. 2x(蓝色)和 4x(橙色)过采样remez设计的线性相位低通数字滤波器的阻带和通带纹波具有相等的通带和阻带权重,作为脉冲响应半长的函数,单位为采样周期为 44.1 kHz 的 1x 采样频率。还绘制了选择 DAC 过采样滤波器的阻带纹波性能数据,其中 AK4499 的 8 倍过采样数字滤波器的相应通带纹波指定为 5×10^-3 dB,组合数字和CS43198 的模拟滤波器,AD1955 的 8 倍过采样数字滤波器为 2×10^-4 dB。此处比较的所有滤波器都具有相同的过渡带边界:20 kHz 至 24.1 kHz。

对于 44.1 kHz 采样频率,当通带和阻带纹波的权重相等时,图 1 给出了线性相位过采样数字滤波器性能的下限,它是滤波器引入的延迟的函数。这个界限并不明显取决于过采样率。DAC 制造商可以选择不同的权重,例如通过增加通带纹波来获得更低的阻带纹波,例如 AK4499。他们还可以通过严格等波纹以外的其他标准来优化过滤器。例如,滤波器可以包括对模拟电路(零阶保持、RC滤波器等)的高频衰减的补偿,并且滤波器延迟特性可能会因使用计算效率高的多速率实现而受到影响。

remez(2*86, [0, 20/44.1, (44.1-20)/44.1, 1], [1, 1, 0, 0], [1, 1], "bandpass", 128)通过绘制其脉冲响应(图 2)和频率响应freqz(图 3),我们可以仔细查看图 1 中性能最高的滤波器,它来自:

在此处输入图像描述
图 2. 最高性能线性相位 2x 过采样滤波器的脉冲响应remez

在此处输入图像描述
图 3. 最高性能线性相位 2x 过采样滤波器的频率响应remez

看看 8x 过采样滤波器会更有趣,但remez失败了error: remez: insufficient extremals--cannot continue.