SIFT中的关键点位置和比例

信息处理 尺度空间
2022-02-16 22:30:31

如果我理解正确,关键点就是一个元组

(x,y,σ,r),
在哪里x,y定义关键点的位置和r一个方向(由关键点周围最主要的梯度向量给出)。我仍然不确定的意图σ.

SIFT第一部分所做的是考虑

L(x,y,σ):=G(x,y,σ)I(x,y),
在哪里I(x,y)表示图像在位置的值(x,y),卷积和G(x,y,σ)具有标准差的高斯滤波器σ, 在位置求值(x,y).

现在考虑DoG,用于不同大小的图像和不同的模糊值σ并收集有趣的点。

这个程序最让我困惑的是Lowe表示σ作为图像的比例。然而,σ只是一个模糊参数。

因此,我定义了缩放图像的模糊图像

L(x,y,σ,s):=G(x,y,σ)Is(x,y),
在哪里Is是图像I按因子缩放s(因此将图像的两个维度乘以 s,然后重新缩放)。因此,DoG 中一个有趣的点是一个点(x,y)在图像中L(x,y,kσ,s)L(x,y,σ,s).

在 Lowe 的论文中,他从不考虑参数 's' 而只是σ. 为什么会这样?我如何关联(x,y)L(x,y,σ,s)到图像中的某个位置I以及为什么要保存模糊参数σ?

现在关键点以什么方式缩放(调整大小)-不变?

在某些DoG的调整大小的图像中是否应该存在一个关键点,该关键点对应于前一个关键点,其周围渐变的方向和大小或多或少相同?这就是Lowe所说的不变性吗?

为了找到一个关键点,一个局部极值L(x,y,σ)围绕一个点(x,y,σ)被认为。通过泰勒展开使用插值极值背后的想法是什么?

谢谢迈克尔斯

1个回答

σ参数是两者。高斯函数可以生成一个尺度空间,其中σ是尺度参数。这并不意味着图像被缩放,而是评估特征的比例。

例如,随着更高σ图像更加模糊,因此只有更大的图像特征对梯度直方图有贡献。SIFT 通过从一组不同尺度的响应中选择最大的特征响应来实现尺度不变。使用高斯函数是因为随着尺度的增加,可以保证不会引入新的局部极值(特征)。

我不确定插值极值,但我想它是为了获得亚像素精度。