我只是在学习图像中的频域。
我可以理解波的频谱。它表示波中存在哪些频率。如果我们画出频谱,我们得到一个脉冲信号和. 我们可以使用相应的过滤器来提取特定的信息。
但是在图像的情况下,频谱意味着什么?当我们在 OpenCV 中对图像进行 FFT 时,我们会得到一张奇怪的图片。这张图片代表什么?它的应用是什么?
我读了一些书,但它们给出了很多数学方程式,而不是物理含义。那么任何人都可以通过在图像处理中的简单应用来提供图像中频域的简单解释吗?
我只是在学习图像中的频域。
我可以理解波的频谱。它表示波中存在哪些频率。如果我们画出频谱,我们得到一个脉冲信号和. 我们可以使用相应的过滤器来提取特定的信息。
但是在图像的情况下,频谱意味着什么?当我们在 OpenCV 中对图像进行 FFT 时,我们会得到一张奇怪的图片。这张图片代表什么?它的应用是什么?
我读了一些书,但它们给出了很多数学方程式,而不是物理含义。那么任何人都可以通过在图像处理中的简单应用来提供图像中频域的简单解释吗?
但是在图像的情况下,频谱意味着什么?
“数学方程”很重要,所以不要完全跳过它们。但 2d FFT 也有直观的解释。为了说明,我计算了一些样本图像的逆 FFT:
如您所见,频域中只设置了一个像素。图像域中的结果(我只显示了实部)是“旋转余弦模式”(虚部将是相应的正弦)。
如果我在频域(左边框)设置不同的像素:
我得到不同的二维频率模式。
如果我在频域中设置多个像素:
你得到两个余弦的总和。
因此,就像可以表示为正弦和余弦之和的一维波一样,任何二维图像都可以(松散地说)表示为“旋转的正弦和余弦”之和,如上所示。
当我们在 opencv 中对图像进行 fft 时,我们会得到奇怪的图像。这张图片代表什么?
它表示正弦/余弦的幅度和频率,当它们相加时,将为您提供原始图像。
它的应用是什么?
真的太多了,无法一一列举。使用 FFT 可以非常有效地计算相关和卷积,但这更像是一种优化,您不会为此“查看”FFT 结果。它用于图像压缩,因为高频分量通常只是噪声。
我认为这在著名的“DSP 指南”(第 24 章,第 5 节)中得到了很好的说明:
傅里叶分析在图像处理中的使用方式与一维信号的使用方式大致相同。然而,图像的信息没有在频域中编码,这使得这些技术的用处大大降低。例如,当对音频信号进行傅里叶变换时,混淆的时域波形被转换为易于理解的频谱。
相比之下,对图像进行傅里叶变换会将空间域中的直接信息转换为频域中的加扰形式。简而言之,不要指望傅立叶变换可以帮助您理解图像中编码的信息。
所以,对典型图像进行DFT得到的看似随机的图案背后当然有一定的结构和意义(比如下面的例子),但并不是人脑准备直观理解的形式,至少在视觉感知方面。
这是另一个有趣且可读性强的说明,说明了图像的傅里叶变换中包含的内容,以及如何解释它。它有一系列图像,非常清楚傅里叶变换和原始图像之间的对应关系。
编辑:也看看这个页面,它演示了——接近尾声——图像的大部分感知重要信息是如何存储在频率表示的相位(角度)分量中的。
编辑2:傅里叶表示中相位和幅度含义的另一个例子:代尔夫特大学教科书“图像处理基础”的“第3.4.1节,相位和幅度的重要性”非常清楚地证明了这一点:
海浪是一维波;它只取决于. 海浪是二维波。这取决于和. 如您所见,您有两个频率,在任一方向。
因此,傅里叶变换 (FFT)会给你, 就像 FFT给你. 如果您的输入是对 2D 余弦求和的函数,那么您的 2D FFT 将是这些余弦频率的总和 - 再次直接模拟 1D FFT。
值得注意的是,傅立叶分析是称为正交函数的概念的一个特例。基本思想是将复杂的信号分解为更简单的“基”函数的线性叠加。您可以对基函数进行处理或分析,然后对基函数的结果求和以获得原始信号的结果。
为了使其工作,对基函数有一定的数学要求,即它们理想地形成正交基。在傅立叶变换的情况下,基函数是复指数。但是,还有许多其他功能也可以用于此目的。