SIFT:为什么仿射翻译是不变的?

信息处理 图像处理 图像分割 数学
2022-02-21 21:27:21

我正在学习 SIFT。我对Lowe的一些算法有点困惑。

为了使描述符对缩放等平移保持不变,我们必须去掉 LoG(高斯的拉普拉斯算子)中的缩放因子。我知道 LoG 是这样表示的:

在此处输入图像描述

那么尺度不变的 LoG 看起来像这样:

在此处输入图像描述

但是DoG怎么会这样呢?:

在此处输入图像描述

换句话说,我们如何通过近似,使用 DoG,摆脱 SIFT 中的比例因子。我知道 DoG 是如何计算的,但问题是我无法理解我们如何摆脱这个因素来获得一个比例不变的 LoG 近似值。任何精确的解释都非常感谢。

编辑:还有一些问题,请准确回答。谢谢 :-) 1- 在 SIFT 的最后一步,我们使用梯度方向计算特征向量。要做到这一点,从每个方向中减去关键点的旋转。我不明白为什么我们要减去它们?

2- 光照依赖怎么办?

任何人都可以解释我们如何删除照明和方向依赖?

1个回答

我认为您已经知道我们如何从 LoG 获得 DoG 的证明,所以我不会继续深入。

根据您的问题“如何通过近似值,使用 DoG,我们摆脱 SIFT 中的比例因子”。DoG 作为特征检测器来检测给定图像中的斑点(类似斑点的形状),您可以说它有点像边缘检测器,这里是使用 DoG 检测到的一些斑点的照片:

在此处输入图像描述

使用尺度空间金字塔在不同尺度上检测到这些斑点。使用更大的 sigma 值,您会得到更大的斑点。正如您在此处看到的,实验性 DoG 为您提供了最佳的规模概念: 在此处输入图像描述

因此,实验性的 DoG 通过构建尺度空间和计算 DoG 并最终提取局部最大值点,为您提供了最强大的尺度不变特征。

有用的链接:

1-讲座PPT

2- SIFT 最著名的视频讲座