如何解读这些 MP3 频谱?

信息处理 声音的 频谱图 音频处理 mp3
2022-02-03 14:40:41

最近,我发现我在我的音乐库中复制了这首歌,但在听它们时,我注意到一个版本的质量明显高于另一个版本,尽管两者都声称具有 320kbps 比特率。

我使用 python 绘制了每个版本的随机 5 秒的频谱图。这是“高质量”MP3 的两个通道的频谱图:

两个通道的高质量频谱图

这是“低质量”的频谱图:

两个通道的低质量频谱图

我注意到的差异是:

  1. 低质量版本的整体强度比高质量文件低很多。随着频率的升高,这种差异更加明显。
  2. 低质量的歌曲在 16 kHz 以上有这种奇怪的断断续续(我认为这是最有趣的特征),而高质量的频谱图似乎更均匀。

在功率谱中,我确认了第 1 点,并且文件确实具有与 320 kbps MP3 匹配的 20 kHz 截止频率。

这是高质量的功率谱: 高质量的功率谱

这是低质量的功率谱: 在此处输入图像描述

我一直在阅读有关 MP3 的文章,首先我怀疑低质量文件可能是 192kbps 的高档文件(因为频谱在 16kHz 以上停止均匀,这与 192kbps mp3 的截止频率相匹配),但我将我的图与实际的 192kbps 进行了比较频谱,他们绝对没有超过 16kHz 的任何信息,所以我认为情况并非如此。

我还读到这种断断续续可能是由于使用了编码算法,但这并不能解释为什么整首歌的力量如此之低(当你听两个版本时很容易注意到这一点)。

有没有对 MP3 有更多经验的人给我暗示这里可能发生的事情?我的意思是,什么可能导致两个文件中的这些差异或我从频谱中丢失的任何其他提示。

最后,我的目标是量化这些可能的差异,以便能够以编程方式检测我的库中的哪些歌曲是“低质量”的,尽管比特率显示为 320 kbps,因此也欢迎任何想法。

2个回答

从您绘制的功率谱来看,数据似乎存在更多偏差。也许当歌曲被录制或编码时,采样率(每秒的样本数)小于原始采样率。

不幸的是,这归结为它编码的人,使用了什么编码器,编码器设置是什么(并且有很多),原始文件来自哪里以及发生了什么预处理。

MP3 没有指定编码算法,并且有许多质量不同的编码器。其中一些是免费软件(如http://lame.sourceforge.net/)它们被业余爱好者大量使用(因为它们是免费的)但不会在专业环境中使用,这可能会导致显着的质量差异. 这些天来,无论如何都没有专业人士会使用 MP3(除非亚马逊强迫他们这样做),因为有更好的选择(AAC、Opus、OGG 等)

最好检查原始来源。如果它来自像亚马逊这样的知名零售商,那可能没问题。如果它来自一个随机的互联网站点,那么您可能得到了您所支付的费用。