DCT 如何去相关图像?

信息处理 图像处理 自由度 相关性 dct 图像压缩
2021-12-25 07:55:38

我在多个地方读到 DCT 去相关Toeplitz矩阵和图像通常具有 Toeplitz 结构。你能用一个例子解释一下 DCT 如何去相关 Toeplitz 矩阵吗?

DFT 示例

DFT 对圆形矩阵进行去相关。这就是我能够理解的方式。
认为X是相关矩阵不是对角线的矩阵。我们想找到一个转变Y=AX这样的相关矩阵Y是对角线。

E[YYT]=E[AXXTAT]=AE[XXT]AT
让特征值分解为
E[XXT]=UΛUT

然后
A=UTgivesE[YYT]=UTUΛUTU=Λ
这是对角线。
所以给定一个矩阵,它的特征向量矩阵去相关它。

考虑一个圆形矩阵

A=[abccabbca]
一种3×3DFT矩阵由下式给出
[1111ww21w2w]andw3=1

我们可以很容易地看到,上述矩阵的所有列(或行,因为它是对称的)都是所考虑的圆形矩阵的特征向量A. 因此,DFT 对圆形矩阵进行去相关。

是否可以以类似的方式显示 DCT 去相关 Toeplitz 矩阵?

PS:这里这里这里的答案并没有解决我的疑问。

1个回答

[编辑] 1991 年,Nasir Ahmed 写道:“我是如何提出离散余弦变换的”。有趣的是,他如何受到切比雪夫多项式的启发,以及他如何没有获得资金,用于 JPEG 和 MP3 的核心工具。

自然图像不是很平稳,但在局部,它们的协方差通常由一阶或二阶过程建模。能够“集中”这些矩阵是有效压缩的关键之一(但不是唯一的)。

换句话说:一个目标是在另一个向量系统(一个基础,一个框架)中投影或表示像素,以便更好地表示图片的信息内容,或者更稀疏地表示。经典地,一个保留能量(因此正交或接近正交变换。两个主要选项:

  1. 从每个图像中计算或学习最佳自适应表示。PRO:压实效率更高;CON:计算成本高且存储丢失,因为应该发送解码
  2. 使用已知且固定的变换(或一组已知变换)。PRO:快;CON:不太理想。

DCT 是选项 2,具有选项 1 的性能:对于大多数标准图像,具有接近自适应性能的固定变换。它奏效了,人们仍然使用 JPEG 和 MP3,其核心是 DCT。

因此,目标是找到这样的特征向量(协方差矩阵,计算成本低于矩阵对角化。来自离散余弦变换(1974)的原始 DCT(DCT-II)旨在找到可以近似对角化一阶Markov Toeplitz 矩阵:

[1ρρN1ρ1ρN2ρN1ρN21]

定义 DCT 的最初动机是它的基组提供了对构成一阶平稳马尔可夫过程的自协方差矩阵的 Toeplitz 矩阵类的特征向量的良好近似,因此它比离散傅里叶变换 (DFT) 和其他一些关于此类过​​程的变换 [l], 3 , 4 。事实上,如图4所示,DCT 渐近等效于一阶平稳马尔可夫过程的 Karhunen-Loeve 变换 (KLT):ρ趋于 1,其中ρ是相关系数。

查看基函数ρ=0.9 特征向量和 DCT

匹配非常好,事实证明处理性能也接近于 Karhunen-Loève 变换的处理性能。

在他们 1995 年的论文Diagonalizing Properties of the Discrete Cosine Transforms中,作者提供了上述属性的扩展。

在本文中,我们获得了八种类型的 DCT 作为由一般形式的矩阵生成的完整正交特征向量集,就像离散傅里叶变换 (DFT) 可以作为任意循环矩阵的特征向量获得一样。这些矩阵可以分解为对称 Toeplitz 矩阵加上 Hankel 矩阵或按一些常数因子缩放的接近 Hankel 矩阵的总和。

1991 年,Nasir Ahmed 写道:“我是如何提出离散余弦变换的”。有趣的阅​​读,一些摘录:

让我感兴趣的是,KLT 确实是基于均方误差准则和一阶马尔可夫过程模型的最优变换,但没有有效的算法来计算它。因此,我的研究重点是确定是否有可能提出可以有效计算的 KLT 的良好近似值。

使用切比雪夫多项式研究“余弦变换”

研究这种“余弦函数”的动机是,它们与 KLT 基函数的一系列相关系数值非常相似 ρ(在协方差矩阵中)。