信息处理 - 什么模式可以最大化 JPEG 文件的大小？ - 吾爱随笔录

信息处理图像处理 JPEG

2022-02-02 16:54:59

据我了解 JPEG 算法，它平滑（忽略）颜色和亮度的逐渐变化，有利于高频。相对于无损算法，这种信息丢失是产生特征性高水平压缩的原因。

所以灰色方块会生成一个小的 JPEG 文件，而网格应该生成更大的文件：-

显然，这样的网格/图案可以是任何间距，直到单个像素。我规定所有图像都是灰度类型。有什么方法可以确定模式的类型以最大化 JPEG 文件的大小，还是必须通过实验来完成？

2个回答

追求@OlliNiemitalo，JPEG 允许一些与频率量化相关的损失。因此，任何文件都可以压缩到任何大小，因此如果不设置一些约束（例如质量），就无法最大化 JPEG 大小。让我们假设一个标准度量，例如均方误差。

现在，让我们检查一些 JPEG 特征的图像稀疏化，并尝试反方向：

很难同时满足所有这些属性，尤其是使用 8 位整数组成的 RGB 平面。忘记平均事物，生成独立的 RGB 图像，每个像素随机 $0$ 或者 $255$ （即高范围）。量化在这里很可能会产生很多假色彩。这可能会为您在 MSE 中的 JPEG 提供非常糟糕的图像。但是，原始的和压缩的可能看起来很丑。

如果您正在寻找一个明确的数学（解析几何等）公式，该公式将生成您定义为在给定 JPEG 编码器实现下压缩最少的几何形状（图案）；我没听说过这样的公式。可能有，但正如我所说，我还没有听说过这样的一个。

但是，考虑到 JPEG 图像压缩算法背后的理论概念，您提出这个问题的方式并不是最合适的方法。如果您查看通用 JPEG 编码器，您会看到有许多块，例如 DCT、Quantizer 和 VLC Huffman 编码器。

我不会详细介绍这些块的理论分析以及如何在物理上实现相关压缩的机制。但是，我将描述在给定编码器下会产生比其他更多位的形状的特征：

将导致最大 JPEG 编码比特流的形状是在采用 DCT 之后，在 DCT 系数被选定的加权矩阵量化之后产生最少数量的连续零和最大幅度系数的形状。

那么哪个图像会这样做呢？它取决于加权矩阵和 DCT。如果您选择基于人类视觉系统的加权矩阵，则图像必须具有过多的高频竞争。这意味着图像必须由锐利且持续时间短的黑白段落组成。

由于 eth DCT 系数的锯齿形扫描模式，它的方向也可能很重要。但如果不进一步分析，很难确定。

因此，具有高动态范围的白噪声图像会产生相当大的文件大小，因为它的 DCT 无法将其频率内容降低到低频系数。

其它你可能感兴趣的问题