我不太确定这里的数学术语,但是......
是否有离散傅立叶变换的变体(或后处理)将信号的形状与应用于整个信号的任何相移分开?
例如,这个图像:
和这个:
在频域中最多应该有 2 个系数(每个维度对应一个)。
或者,有没有一种方法可以索引图像,以便在将翻译副本作为键的情况下,可以在数据库中找到任何图像?
笔记
- 我的图像都是 1D 或 2D 的,具有二次方大小(但不一定是正方形。)
- 该项目与 OCR 无关(即使我在示例中使用了字符字形。)请不要建议 OCR 特定的算法/库!
我不太确定这里的数学术语,但是......
是否有离散傅立叶变换的变体(或后处理)将信号的形状与应用于整个信号的任何相移分开?
例如,这个图像:
和这个:
在频域中最多应该有 2 个系数(每个维度对应一个)。
或者,有没有一种方法可以索引图像,以便在将翻译副本作为键的情况下,可以在数据库中找到任何图像?
笔记
由于这是模板图像与其空间(和循环)平移变体的比较,因此两者的功率谱将保持不变,但相位谱将不同。
我相信在您的示例中,您的图像和模板之间的简单循环卷积方法将是您想要的。结果也是一个图像,一旦你有了它,你就可以搜索一个峰值。如果您将模板与其自身进行循环卷积,该峰在垂直/水平方向上与您通常会得到的峰相差多少,将分别为您提供水平和垂直空间中的空间延迟。
您可以通过对模板图像(第一个)进行(与图像大小相同)傅里叶变换,并将其与图像的傅里叶变换(第二个)相乘,然后将结果逆傅里叶变换回空间域。在那里,您可以寻找第一段中提到的峰值。
正如您所说,这是假设您的图像大小相同。