为什么高斯尺度空间尺度不变的差异?

信息处理 图像处理 计算机视觉 尺度空间
2021-12-19 03:37:35

我将在这里使用Scale-invariant 特征变换算法作为示例。SIFT 基于图像的缩放高斯滤波创建一个尺度空间,然后计算高斯差以检测潜在的兴趣点。这些点被定义为跨高斯差的局部最小值和最大值。

据称这种方法是尺度不变的(在其他令人费解的不变性中)。为什么是这样?我不清楚为什么会这样。

2个回答

术语“尺度不变”在此意味着以下。假设您有图像I ,并且您在某个位置(x,y)和某个尺度级别s检测到一个特征(也称为兴趣点)f现在假设您有一个图像I',它是 I 的缩放版本例如,下采样)。那么,如果你的特征检测器是尺度不变的,你应该能够在对应的位置(x',y')和对应的尺度s'处检测到对应的特征f' in I',其中(x, y, s)(x', y', s')通过适当的缩放变换相关。

换句话说,如果您的尺度不变检测器检测到与某人的面部相对应的特征点,然后您在同一场景中使用相机放大或缩小,您仍然应该检测到该面部上的特征点。

当然,您还需要一个“特征描述符”,它允许您匹配这两个特征,这正是 SIFT 给您的。

因此,冒着进一步混淆您的风险,这里有两件事是尺度不变的。一个是 DoG 兴趣点检测器,它是尺度不变的,因为它可以检测特定类型的图像特征(斑点)而不管它们的尺度。换句话说,DoG 检测器检测到任何大小的斑点。另一个尺度不变的东西是特征描述符,它是梯度方向的直方图,尽管尺度发生变化,但对于相同的图像特征,它或多或少地保持相似。

顺便说一句,这里使用高斯差作为高斯拉普拉斯滤波器的近似值。

高斯差不是尺度不变的。SIFT(在有限程度上)尺度不变,因为它在尺度空间中寻找 DoG 极值——即在空间上和相对于相邻尺度上寻找具有 DoG 极值的尺度。因为输出DoG是针对这个固定比例(不是输入比例的函数)获得的,所以结果是与比例无关的,即比例不变的。