图像处理和傅里叶变换

信息处理 图像处理 计算机视觉
2021-12-29 12:31:55

我试图了解傅里叶变换如何以及为什么用于图像处理/计算机视觉。以下是我到目前为止收集的内容。我对它的理解是否正确?如果没有,有人可以用简单明了的英语向我解释吗?或者,有人有什么要补充的吗?最后但并非最不重要的一点是,有人可以解释“离散傅立叶变换”吗?

傅立叶变换将图像分解为其正弦和余弦分量。简而言之,正弦和余弦分别是从最小值和最大值开始的波。在现实世界中,我们无法判断我们观察到的波是从最大点还是最小点开始的,因此我们无法真正区分两者。因此,正弦和余弦简称为正弦曲线。

将 FT 应用于图像时,我们将其从空间域转换为“频域”,其本质上是用颜色和亮度随时间的变化来表示的图像(嗯,不是时间,而是空间。那是,超过多个像素)。

编辑:我为什么要使用傅立叶变换?与其他方法相比,它有什么好处?例如,文献中的一种应用是形状识别或噪声消除。基本而言,如何使用 FT 进行形状识别?

1个回答

在概念层面上,傅里叶变换以这些正弦曲线的频率告诉您图像中发生了什么。例如,如果您有一张普通墙壁的图片,从左到右或从上到下,像素值变化很小。在频域中,这意味着您的图像包含低频,但没有高频。

另一方面,如果你有一张尖桩栅栏的图片,那么像素的值会随着你从左到右一直在变化。因此,在傅立叶域中,您在 X 方向有高频,但在 Y 方向没有。

最后,如果你有一张棋盘的图片,那么像素值在两个方向上都会发生很大变化。因此,图像的傅里叶变换在 X 和 Y 中都将具有高频率。

因为傅里叶变换可以告诉您图像中发生了什么,所以根据图像处理操作对图像中包含的频率的作用来描述图像处理操作通常很方便。例如,消除高频会使图像模糊。消除低频会给你带来优势。并且在保持低频的同时增强高频可以使图像锐化。

FFT 广泛用于图像处理和计算机视觉。例如,卷积是一种基本的图像处理操作,使用 FFT 可以更快地完成。用于图像去模糊的维纳滤波器是在傅里叶变换的 therms 中定义的。但更重要的是,即使不直接使用傅里叶变换,它也为推理图像处理操作提供了一个非常有用的框架。

Steve Eddins 是“使用 MATLAB 进行数字图像处理”的作者之一,他有一系列关于傅里叶变换及其在图像处理中的应用的博客文章。