什么模式可以最大化 JPEG 文件的大小?
追求@OlliNiemitalo,JPEG 允许一些与频率量化相关的损失。因此,任何文件都可以压缩到任何大小,因此如果不设置一些约束(例如质量),就无法最大化 JPEG 大小。让我们假设一个标准度量,例如均方误差。
现在,让我们检查一些 JPEG 特征的图像稀疏化,并尝试反方向:
- JPEG 假设 RGB 颜色平面具有相似性,例如与亮度/色度变换相关。所以你选择独立的R、G、B,你就不错了
- 8除了之前的块(光栅顺序)预测的平均值之外,补丁几乎是独立压缩的。如果您有相邻的块具有非常不同的手段,很好
- 高频越多,8越少8挡为固有频率,效果更好。它们避免了由 EOB 符号编码的长零轨迹。
很难同时满足所有这些属性,尤其是使用 8 位整数组成的 RGB 平面。忘记平均事物,生成独立的 RGB 图像,每个像素随机或者(即高范围)。量化在这里很可能会产生很多假色彩。这可能会为您在 MSE 中的 JPEG 提供非常糟糕的图像。但是,原始的和压缩的可能看起来很丑。
您可以在 What is the least JPG-compressible pattern?(相机拍摄一块布,比例/角度/照明可能会有所不同)
如果您正在寻找一个明确的数学(解析几何等)公式,该公式将生成您定义为在给定 JPEG 编码器实现下压缩最少的几何形状(图案);我没听说过这样的公式。可能有,但正如我所说,我还没有听说过这样的一个。
但是,考虑到 JPEG 图像压缩算法背后的理论概念,您提出这个问题的方式并不是最合适的方法。如果您查看通用 JPEG 编码器,您会看到有许多块,例如 DCT、Quantizer 和 VLC Huffman 编码器。
我不会详细介绍这些块的理论分析以及如何在物理上实现相关压缩的机制。但是,我将描述在给定编码器下会产生比其他更多位的形状的特征:
将导致最大 JPEG 编码比特流的形状是在采用 DCT 之后,在 DCT 系数被选定的加权矩阵量化之后产生最少数量的连续零和最大幅度系数的形状。
那么哪个图像会这样做呢?它取决于加权矩阵和 DCT。如果您选择基于人类视觉系统的加权矩阵,则图像必须具有过多的高频竞争。这意味着图像必须由锐利且持续时间短的黑白段落组成。
由于 eth DCT 系数的锯齿形扫描模式,它的方向也可能很重要。但如果不进一步分析,很难确定。
因此,具有高动态范围的白噪声图像会产生相当大的文件大小,因为它的 DCT 无法将其频率内容降低到低频系数。