图像处理中是否有零填充的经验法则?

信息处理 图像处理 fft 图片 零填充
2022-02-04 02:52:29

我看到有很多关于为什么需要零填充以及它如何避免环绕图像两侧的答案。但是,对于图像处理有多少填充有好处,是否有经验法则?我主要是从以下角度思考:

a.) 处理图像的速度

b.) 噪音

到目前为止,我已经提到了以下答案:

  1. 为什么在频域滤波之前需要对图像进行填充
  2. 零填充的优点/缺点
  3. FFT 零填充 - 幅度变化

回应将不胜感激。

谢谢你。

2个回答

参见 Press 等人。“C++ 中的数值配方”。第 13 章“傅立叶和光谱应用”,第 13.1 节,其中有一个小节题为“通过零填充处理末端效应”。这可能是文献中任何地方对零填充的最佳总结(但在内容或索引中均未提及)。这本书我的版本是2002年第二版,页码是545。

我确实认为零填充是其他两个基本操作的常用组合形式:

  • “延期”,
  • “窗口”,

对于有限长度的数据(信号、图像)。

[插曲] 我不知道一个通​​用的词(比如companding,它结合了 compressing 和 expand)。各位 SE.DSPers,如果你知道一个,请分享。否则,我会建议“ extowing ”。我将从“窗口”部分开始。

  • 开窗: 虽然关于 1D 窗口的设计有大量文献,但我既没有被教导/接触过,也没有看到太多关于 2D(和 nD)设计的参考资料。如果我专注于 2D 窗口本身(除了窗口之外没有其他目的),在我的书目参考列表(10.900 多个项目和计数)中,只有少数这样的参考,大部分是古老的,例如:Huang, TS, 1970,二维窗口(引用:“已经设计了许多好的一维窗口,但是,研究的二维窗口相对较少。”)或Coulombe, S. 和 Dubois, E.,1996,任意格上的多维窗口及其在 FIR 滤波器设计中的应用 我所知道的大多数本身设计是:

    • 张量,一维窗口的可分离外积
    • 一维设计的不可分离的圆形扩展,其中一个居中的W(t)=w(|tt0|)窗口以某种规范转换为 2DlW(x)=w(l(xx0)),具有离散化和归一化的副作用,
    • 不可分离的“1D 启发”2D 优化(如 McClellan)。

但是,我还没有看到很多它们在图像处理软件中原生实现(除了张量化的 1D 窗口和2D 离散化的高斯函数)。

  • 扩展:由于不同的原因,数据扩展是图像处理中的常见做法。例如,在JPEG Discrete cosine transform padding中,使用扩展来处理宽度或高度不能被 8 整除的图像。此外,DCT 类型 II 具有有益的对称特征,这些特征实际上很有用。可以仅应用零填充,但边界处出现强伪影的风险非常高。有用的扩展可能强烈依赖于图像应用和形态。例如,许多声音/振动信号是零均值的,并且可以很容易地通过一点锥度进行零扩展。同时,标准图像有[0,255]像素值,因此不是零均值。因此,有时在边界处使用常数(零阶)或线性扩展,并且存在关于自适应(因果)图像滤波的窗口的文献(RM Mersereau;DE Dudgeon,1975,二维数字滤波JH McClellan,1982,多维谱估计)。

两种操作(加窗和扩展)在多速率或多尺度滤波器组的设计中自然结合,其中并行的加窗通带滤波器组被设计在一起,以允许像素块之间的重叠(以避免明显的不连续性)和完美的重建(精确反转)。重叠正交变换 (LOT) 是典型的,每边有 50% 的重叠。嵌入在准酉滤波器滤波器组的上下文中,许多作品派生了对称或反对称图像扩展,以受益于滤波器中固有的对称性。类型学通常是四重的,具有半样本或全样本对称,以及对称或反对称他们试图保持跨块的“图像”连续性或可区分性。

但是,让我们变得实用。如果你有足够的内存,我的经验是你真的很安全,首先,如果你执行 4 倍图像扩展(对称或反对称,取决于数据)和窗口:每个边缘 50%,并且可分离一维窗口设计,带幂升余弦窗口。