在比较两个不同音频源之间的频谱图像以确定哪个质量更好时,我有时会陷入僵局。例如,考虑以下来自两个 320kbps mp3 文件的图像:
RGB值的光学差异:
(这是上述示例的波形同步版本之间的区别,但完全相同)
第二个版本的截止频率为 20 KHz,而第一个版本包含一些高于该频率的音频信息,尽管强度非常低,并且可能听不见。
另一方面,图顶部的这个额外音频部分似乎是噪音,因为它是由一个几乎连续的“模糊”区域组成的。此外,仔细观察这两个图像,可以在较低频率处观察到一些细微的差异。
从理论上讲,我倾向于认为第二个版本质量更好,因为截止下限可能允许编码器更好地利用可用带宽,从而可以更准确地表示较低频率。除此之外,我真的不知道如何解释这两个图像之间的这些细微差异以做出客观的决定。
那么,在比较光谱图像时,哪些具体细节可以帮助确定哪个编码器做得更好呢?

