当使用离散余弦变换时,是否有常用的量化替代方法来决定哪些 dct 分量要保留/重要?如果不是,人们如何根据常见图像、数学等的经验属性提出量化矩阵(例如在 JPEG 中),这纯粹是任意的吗?
DCT:量化的替代方案
信息处理
dct
压缩
量化
2022-02-03 19:34:55
2个回答
从我读到的内容来看,有一些针对不同应用程序的量化矩阵,Adobe Photoshop 有 15 个左右。这个想法是,虽然这些矩阵有基于误差的数学计算,但推导出一个好的量化矩阵的最佳方法是简单地使用人眼(在 JPEG 的情况下)我还没有看到任何不遵循的量化矩阵右下频率有重罚(高数)的总体趋势,尽管一些图像的高频系数很大,但较低的频率通常更大。
DCT 系数驻留在类似于频率的域中。因此,如果您有一个适应频域的模型,它可以以某种方式应用于 DCT 系数。只有您的标签谈论压缩,所以让我们假设我们谈论 DCT 域中的任何类型的处理。您可以计算 10% 的最低系数的中值能量,并只保留那些高两倍的能量。这将是一种收缩形式,与上述中值阈值有关。仅当(4 或 8)个周围系数至少为其值的十分之一时,您才能保留系数。它是一种块选择。
所以,总而言之,重要的应该放在模型中(几乎引用@MarcusMuller)。对于人类观看的场景的压缩,使用视觉模型和图像行为模型。此答案中提供了有关 DCT 系数行为的详细信息。正如您所注意到的,标准表不是对称的:一个量化的水平特征多于垂直特征。对于人类和许多陆生哺乳动物来说,垂直分量的灵敏度要高一些。我听到的唯一解释是,我们更能适应即将出现的危险。
但是,如果您决定压缩零均值中频纹理怎么办?那么基本矩阵就不是很合适了。设计一个保留中频特征的 Q 矩阵更为有效,尽管它包含在 JPEG 文件的标题中。由于 JPEG 标准未知,解码器所需的新 Q 矩阵导致的大小增加是由于更好的矩阵而导致的质量改进的补偿。
我一直在研究卫星图像压缩。在那里,水平和垂直是相对的,我们使用自定义 Q 矩阵。
其它你可能感兴趣的问题