我了解离散余弦变换如何用于 JPEG 等标准中的图像压缩。然而,小波的概念对我来说是个谜。我确实知道小波是具有类似波的函数的函数,其值 > 0 仅在很短的时间间隔内,然后它们就消失了。这就是为什么它们被称为小波。我不知道了
我不清楚这些函数究竟如何帮助图像压缩并实现比我们的其他变换(如余弦变换)更高的压缩率。
学习这个的最好的地方是什么?
我了解离散余弦变换如何用于 JPEG 等标准中的图像压缩。然而,小波的概念对我来说是个谜。我确实知道小波是具有类似波的函数的函数,其值 > 0 仅在很短的时间间隔内,然后它们就消失了。这就是为什么它们被称为小波。我不知道了
我不清楚这些函数究竟如何帮助图像压缩并实现比我们的其他变换(如余弦变换)更高的压缩率。
学习这个的最好的地方是什么?
常用的基于小波的标准是 JPEG 2000,常用的基于 DCT 的标准是 JPEG。
JPEG 2000 使用小波,但它实现的比 JPEG 更好的压缩的很大一部分是由于 JPEG 使用简单得多的熵编码器(JPEG 使用上下文相关的霍夫曼编码和运行长度编码,JPEG 2000 使用一些额外的技巧)。通过调整熵编码阶段,您可以获得很多收益。您选择的特定小波变换也会产生影响。以及如何决定压缩系数也会产生巨大的差异(JPEG 以之字形模式读取其 dct 块系数,并使用运行长度编码来压缩较高频率分量中的长时间零运行,因为量化器的性质它用)。
JPEG 2000 中使用的小波与以 JPEG 的方式舍入 DCT 系数的主要优点是它减少了块状伪影。
如果您不熟悉小波,可以查看有关小波的介绍性文本,例如 Mallat 的 Wavelet tour of Signal Processing 或Vetterli 的新书(可在线免费获得)。然后,您可以阅读 JPEG 2000 标准。这些笔记在高层次上也很好(并且它有很好的参考指针)。
要快速查看 JPEG,您可以查看 Gonzalez & Woods 的数字图像处理(第二版或第三版应该没问题)。
我认为在帧内模式下使用块变换的现代视频编解码器具有更好的主观/客观压缩或至少与 jpeg 2000 相当。参见例如: https ://hal.archives-ouvertes.fr/hal-02169185/document
另请参阅 Apple 用作 jpeg 替代品的基于 h265-intra 的 heif 静止图像格式: https ://en.m.wikipedia.org/wiki/High_Efficiency_Image_File_Format
压缩效率稍低但提供适当灵活性(或简单性)、较低计算成本、可扩展性、对存储错误的鲁棒性的编解码器可能是更好的选择。编解码器的成功还与许可证/专利、政治、硬件加速的可用性以及特殊 cpu 指令(如 simd)的适用性有关。
虽然小波可能是一个具有良好数学发展基础的美丽理论,但我的印象是,在数字计算机上的实际编解码器实现中,传统的 dsp 方法表现得非常相似并且非常具有竞争力——小波一旦被实现就很难与滤波器组区分开来代码或逻辑门。一些小波的支持者似乎没有意识到 50 年的 dsp 历史,他们宁愿将小波与整个图像 ffts 或类似的表示相提并论,这使得小波看起来比现实更具革命性。
连续小波确实是摆动并最终消失的函数。对于图像压缩中使用的离散的,它们是另一种观点。给定一个块像素大小,小波将其转换为四个 块,包含与原始块相同的信息内容,但希望以一种方式重新组织,使有用信息首先弹出,以便更容易压缩:因为显着数据更明显,因为不太有用的信息分散,因为它更快,无论如何。四个部分,通常是:
希望子图像 A、D、H、V 在某种程度上比原始图像更简单;因此更容易编码。一些组合的小波属性允许这种情况发生:
然后,我们可以保留一个最高小波系数的列表。只有 10 个中的一小部分可以对图像的大部分进行编码。分解在某种程度上是稀疏的。但是,它们可以多么优雅,实际的系数编码有点复杂,其他方案在压缩比、视觉质量和速度方面可以更有效。
请注意,小波压缩可用于某些领域,如预制作电影存储、医学成像。它还可以用于异构树维网格的编码,就像我们在 HexaShrink 中所做的那样,HexaShrink 是具有属性和不连续性的六面体网格的精确可扩展框架:地球科学模型的多分辨率渲染和存储,结合了 12、2D 和 3D 小波。
在 Mallat 在Wavelet Analysis & Its Applications A Wavelet Tour of Signal Processing的介绍中,他解释了傅里叶变换如何适应“平稳”(平移不变)信号(cos、sin),以及小波如何适应瞬态或局部信号。
傅立叶编码不像小波那样自然地表示局部信号、属性。
然而,小波的局部性很好,并且只需要很少的系数来表示局部瞬态结构。与傅里叶基相反,小波基定义了分段规则信号的稀疏表示,其中可能包括瞬态和奇点。在图像中,大的小波系数位于边缘和不规则纹理的附近。