下图是在频域中使用 Gabor 滤波器滤波的图像的幅度和相位。我正在尝试重现结果,我得到了我认为的幅度的有效结果,但是我在相位上苦苦挣扎,我只是得到一个与图片不相似的嘈杂图像。我正在参考这篇论文2
我的代码大致如下(Python + OpenCV):
# DFT of the source image
dft = cv2.dft(...)
# DFT of the Gabor filter
kernel_dft = cv2.dft(...)
filtered = dft * kernel_dft # using cv2.mulSpectrums()
image = cv2.idft(filtered)
image
然后是复杂的数组,所以我cv2.cartToPolar()
用来提取幅度和相位。
但我正在努力以下段落的确切含义(来自论文):
产生的空间频带在空间、尺度和方向上是局部的(滤波器设计步骤参见 [Portilla 和 Simoncelli 2000])。复杂可导向金字塔的传递函数仅包含相应真实可导向金字塔滤波器的正频率。也就是说,2 cos(!x) = e^(iwx) + e^(iwx) 的响应是 e^(iwx),因此存在幅度和相位的概念。
我不确定如何继续,因为我不是这方面的专家,所以如果有人可以提供一些澄清,我会很高兴。