[编辑] 1991 年,Nasir Ahmed 写道:“我是如何提出离散余弦变换的”。有趣的是,他如何受到切比雪夫多项式的启发,以及他如何没有获得资金,用于 JPEG 和 MP3 的核心工具。
自然图像不是很平稳,但在局部,它们的协方差通常由一阶或二阶过程建模。能够“集中”这些矩阵是有效压缩的关键之一(但不是唯一的)。
换句话说:一个目标是在另一个向量系统(一个基础,一个框架)中投影或表示像素,以便更好地表示图片的信息内容,或者更稀疏地表示。经典地,一个保留能量(因此正交或接近正交变换。两个主要选项:
- 从每个图像中计算或学习最佳自适应表示。PRO:压实效率更高;CON:计算成本高且存储丢失,因为应该发送解码
- 使用已知且固定的变换(或一组已知变换)。PRO:快;CON:不太理想。
DCT 是选项 2,具有选项 1 的性能:对于大多数标准图像,具有接近自适应性能的固定变换。它奏效了,人们仍然使用 JPEG 和 MP3,其核心是 DCT。
因此,目标是找到这样的特征向量(协方差矩阵,计算成本低于矩阵对角化。来自离散余弦变换(1974)的原始 DCT(DCT-II)旨在找到可以近似对角化一阶Markov Toeplitz 矩阵:
⎡⎣⎢⎢⎢⎢⎢⎢1ρ⋮ρN−1ρ1⋮ρN−2⋯⋯⋱⋱ρN−1ρN−2⋮1⎤⎦⎥⎥⎥⎥⎥⎥
定义 DCT 的最初动机是它的基组提供了对构成一阶平稳马尔可夫过程的自协方差矩阵的 Toeplitz 矩阵类的特征向量的良好近似,因此它比离散傅里叶变换 (DFT) 和其他一些关于此类过程的变换 [l], 3 , 4 。事实上,如图4所示,DCT 渐近等效于一阶平稳马尔可夫过程的 Karhunen-Loeve 变换 (KLT):ρ趋于 1,其中ρ是相关系数。
查看基函数ρ=0.9
匹配非常好,事实证明处理性能也接近于 Karhunen-Loève 变换的处理性能。
在他们 1995 年的论文Diagonalizing Properties of the Discrete Cosine Transforms中,作者提供了上述属性的扩展。
在本文中,我们获得了八种类型的 DCT 作为由一般形式的矩阵生成的完整正交特征向量集,就像离散傅里叶变换 (DFT) 可以作为任意循环矩阵的特征向量获得一样。这些矩阵可以分解为对称 Toeplitz 矩阵加上 Hankel 矩阵或按一些常数因子缩放的接近 Hankel 矩阵的总和。
1991 年,Nasir Ahmed 写道:“我是如何提出离散余弦变换的”。有趣的阅读,一些摘录:
让我感兴趣的是,KLT 确实是基于均方误差准则和一阶马尔可夫过程模型的最优变换,但没有有效的算法来计算它。因此,我的研究重点是确定是否有可能提出可以有效计算的 KLT 的良好近似值。
使用切比雪夫多项式研究“余弦变换”
研究这种“余弦函数”的动机是,它们与 KLT 基函数的一系列相关系数值非常相似
ρ(在协方差矩阵中)。