信息处理 - 如何解读这些 MP3 频谱？ - 吾爱随笔录

最近，我发现我在我的音乐库中复制了这首歌，但在听它们时，我注意到一个版本的质量明显高于另一个版本，尽管两者都声称具有 320kbps 比特率。

我使用 python 绘制了每个版本的随机 5 秒的频谱图。这是“高质量”MP3 的两个通道的频谱图：

这是“低质量”的频谱图：

我注意到的差异是：

在功率谱中，我确认了第 1 点，并且文件确实具有与 320 kbps MP3 匹配的 20 kHz 截止频率。

这是高质量的功率谱：

这是低质量的功率谱：

我一直在阅读有关 MP3 的文章，首先我怀疑低质量文件可能是 192kbps 的高档文件（因为频谱在 16kHz 以上停止均匀，这与 192kbps mp3 的截止频率相匹配），但我将我的图与实际的 192kbps 进行了比较频谱，他们绝对没有超过 16kHz 的任何信息，所以我认为情况并非如此。

我还读到这种断断续续可能是由于使用了编码算法，但这并不能解释为什么整首歌的力量如此之低（当你听两个版本时很容易注意到这一点）。

有没有对 MP3 有更多经验的人给我暗示这里可能发生的事情？我的意思是，什么可能导致两个文件中的这些差异或我从频谱中丢失的任何其他提示。

最后，我的目标是量化这些可能的差异，以便能够以编程方式检测我的库中的哪些歌曲是“低质量”的，尽管比特率显示为 320 kbps，因此也欢迎任何想法。