对尺度空间理论的理解

信息处理 图像处理 计算机视觉 尺度空间
2021-12-28 08:54:39

在尺度空间理论中,信号(在图像的情况下)的尺度空间表示为: 其中是具有参数的高斯核,是卷积。通过改变参数,我们得到一个或多或少平滑的图像。结果,更粗略的表示(参数)将不包含小物体或噪声。f(x),x=(x1,...,xd)d=2L(x,y;t)=g(x,y;t)f(x,y)g(x,y;t)ttt

重点是找到一种尺度不变特征检测的方法,对吧?因此,对于某些尺寸缩小的图像,即使尺寸不同,也可以正确检测关键点等特征,而不会找到其他噪声关键点。

  1. 在论文中,他们使用了归一化导数。 使用归一化导数是什么意思,它对尺度不变性有何帮助?γδξ,γnorm=tγ/2δxγ

  2. 从这张图片中我们可以看到,在相同的位置附近发现了不同的关键点(大小不同)。这怎么可能?

检测到的特征

如果你能解释尺度不变特征检测的逐步算法,那就太好了。实际做了什么?导数可以由获取。Blob 可以通过变量的导数在这里有什么帮助?x,ytL(x,y)t

我正在阅读的论文是:具有自动比例选择的特征检测

1个回答
  1. 真的好久没看Lindeberg的论文了,所以这个符号看起来有点奇怪结果,我最初的答案是错误的。 γ不是规模级别。它似乎是某种可以调整的参数。确实,您需要将导数乘以适当的幂t.t本身对应一个尺度级别,幂取决于导数的数。

  2. 您可以在同一位置找到多个比例的关键点。那是因为你在尺度上寻找局部最大值。直觉是这样的:想象一张脸的图像。在精细的尺度上,你会得到一个与鼻子相对应的斑点。在课程规模上,您会得到一个对应于整个脸部的斑点。这两个 blob 以同一点为中心,但具有不同的比例。

  3. 这是整个算法:

    • 确定您感兴趣的图像特征(例如斑点、角落、边缘)
    • 根据导数定义相应的“检测器函数”,例如用于斑点的拉普拉斯算子。
    • 在一定范围内计算检测器功能所需的导数。
    • 将导数响应乘以tmγ/2, 在哪里m是导数的阶数,以补偿幅度减小。
    • 在整个尺度空间上计算检测器函数。
    • 找到检测器函数的局部最大值x,y,t.
    • 这些是您的兴趣点或关键点。

编辑:

  1. 林德伯格在论文中证明tγ/2是导数归一化的适当因子。我不认为我可以在这里复制证明。
  2. 您不采取衍生品t. 您只计算关于的导数xy,但是您在一定范围内计算它们。考虑这一点的一种方法是首先生成一个高斯尺度空间,通过使用具有一定方差的高斯滤波器反复模糊图像t. 然后计算关于的导数xy在每个尺度级别。
  3. 您想在尺度上找到局部最大值,因为您可能在同一位置具有不同大小的图像特征。想象一个同心圆的图像,就像一个靶心。它将在几个尺度上为您提供拉普拉斯算子的高响应。或者想一想由拉普拉斯算子在一定范围内过滤的真实人眼图像。您将在瞳孔的精细尺度上获得高响应,在虹膜的中等尺度下获得高响应,在整个眼睛的粗略尺度下获得高响应。

关键是您不知道感兴趣的特征可能提前达到什么规模。所以你看看所有的尺度。