音频,仅根据内容估计编解码器的压缩比

信息处理 fft 声音的 C C++ 压缩
2022-02-24 00:03:52

我是关于音乐音频的。

这些可以通过不同程度的不同格式压缩。(即我不是指动态压缩)。

在经过很大程度的压缩(比如 96kbps mp3)之后,音频可能会以较低的“假”压缩程度(比如 224kbps)保存。

有没有办法估计音频内容的 实际压缩程度(在上面的例子中:从 224 kpbs 中得知内容不超过 100 kps)?

到目前为止我计算的特性(频率分布、相移等)显示不同压缩比的结果之间没有差异。

现在我从编解码器方面考虑:可能主要是心理声学。所以......也许正在寻找它的典型效果:掩蔽、冲动行为等?

有什么经验、提示、想法可以计算吗?

我看不到与其他线程的建议答案有任何联系。(这是关于找到信号与给定模式的相关性(在这种情况下打鼾)。但我的问题完全不同:我需要知道信号中是否有任何特征来判断它是否已被编解码器压缩,然后再次“炸毁”。我没有任何“主人”;既没有想要的信号,也没有噪音/打鼾。只是一个音频,我想知道它是否和它的技术规格一样好还是更糟,因为它以前被压缩了很多,而且我不知道。)

1个回答

如果您知道参考输入,您可能会通过以所有不同比特率尝试所有不同的编解码器直到匹配到一个来对编解码器行为进行逆向工程。或者,您可能会设置已知用于一个特定编解码器的滤波器组的迹象(频域中的矩形斑块,其中能量刚好高于/高于/高于/不被传输的阈值)。

但总的来说,这是一个难题。允许编解码器执行他们认为会使音频听起来“相似”但比特率降低的任何线性 le 非线性操作。音频到 MIDI 到音频的链将是(极端)压缩的假设示例。仅给定其输出样本,您将如何检测到这一点?

-k