采样率非常高的音质,但抖动的位深度非常低?

信息处理 采样 位深度 抖动
2022-02-21 06:55:28

这个问题可能更多的是为了好玩和理论,但是如果你创建一个具有非常高的采样率(如 192kHz)和非常低的位深度(例如 3 位)的声音,音质会如何?

你能用 192kHz/3bit (+dithering) 模拟 44.1kHz/16bit 吗?

我可能会考虑清楚这一点并自己发布一个答案,在 MATLAB 中计算的声音示例,但也许有人已经这样做了:)

1个回答

好吧,有一个关于这个的信息论定理(称为 Gerzon-Craven 极限)很久以前由 Michael Gerzon 和 Peter Craven 在 80 年代后期发表。我无法获得论文参考的直接链接,但在AES公约论文网站中输入“数字信号的最佳噪声整形和抖动”这篇论文已有四分之一世纪的历史。我刚刚发现我有那个旧 AES 预印本的相机副本,如果你给我发电子邮件到rbj@audioimagination.com ,我可以把它发给你。

我还有一篇论文的副本,其中提到了 Gerzon-Craven 限制音频重新量化的心理声学噪声整形

关于这个有一个有趣的标题,叫做Approaching the Gerzon-Craven Noise Shaping Limit Using Semi-Infinite Programming Techniques我没有那个副本,也不知道如何获得免费副本。

本质上,由于香农信道容量定理,只要您不关心原始 22.05 kHz 基带之外的量化噪声幅度,您的问题的答案就是“理论上几乎是的”。这是因为 16 位 44.1 kHz 的比特率与 3 位 192 kHz 的比特率大致相同(可能只是多一点点),您可以提出一个信息论案例,因为信息两种情况的比率大致相同,则感兴趣频带中的信噪比也大致相同。

但真正的答案是“不,实际上”,因为很难构建具有如此极端规格且保持稳定的 3 位噪声整形调制器。采样率高于 192 kHz,规格变得不那么极端。

如果你有一个工作系统(它是用什么编码的,MATLAB?),我会对你的噪声形调制器感兴趣。它是什么顺序以及它的表现如何。有时,这些讨厌的高阶 ΣΔ 调制器在无声的情况下表现不佳,我们得到所谓的“空闲音调”如果你认为你有一个可行的解决方案,我很想听听它是如何处理非常低级别的输入的。