所以,我正在阅读关于SURF 的论文(Bay,Ess,Tuytelaars,Van Gool:Speeded -Up Robust Features (SURF)),我无法理解下面的这一段:
由于使用了箱形过滤器和积分图像,我们不必迭代地将相同的过滤器应用于先前过滤层的输出,而是可以直接在原始图像上以完全相同的速度应用任何大小的箱式过滤器,并且即使是并行的(尽管这里没有利用后者)。因此,通过放大滤波器大小而不是迭代减小图像大小来分析尺度空间,图 4。
This is figure 4 in question.
PS:论文有整体图像的解释,但论文的全部内容是基于上面的特定段落。如果有人读过这篇论文,你能简单介绍一下这里发生了什么吗?整个数学解释非常复杂,首先要很好地掌握,所以我需要一些帮助。谢谢。
编辑,几个问题:
1.
每个八度音阶被细分为恒定数量的音阶级别。由于积分图像的离散性,2 个后续尺度之间的最小尺度差取决于偏二阶导数在求导方向(x 或 y)上的正叶或负叶的长度 lo,设置为过滤器尺寸长度的三分之一。对于 9x9 滤波器,此长度 lo 为 3。对于两个连续的级别,我们必须将此大小至少增加 2 个像素(每边一个像素),以保持大小不均匀,从而确保中心像素的存在. 这导致掩码大小总共增加了 6 个像素(参见图 5)。
Figure 5
我无法理解给定上下文中的线条。
对于两个连续的级别,我们必须将此大小至少增加 2 个像素(每边一个像素),以保持大小不均匀,从而确保中心像素的存在。
我知道他们正试图对图像的长度做一些事情,如果它甚至试图让它变得奇怪,那么有一个中心像素将使他们能够计算像素梯度的最大值或最小值。我对它的上下文含义有点不确定。
2.
为了计算描述符,使用了 Haar 小波。
中间区域的低但.
3.
有一个近似过滤器的必要性是什么?
4. 我对他们发现过滤器大小的方式没有意见。他们凭经验“做了”一些事情。但是,我对这条线有一些唠叨的问题
上一节介绍的 9x9 滤波器的输出被认为是初始尺度层,我们将其称为尺度 s = 1.2(用 σ= 1.2 逼近高斯导数)。
他们是如何发现 σ 的值的。此外,下图中显示的缩放计算是如何完成的。我之所以要说明此图像,是因为值s=1.2
不断重复,但没有明确说明其来源。
5.
Hessian Matrix 表示L
为高斯滤波器的二阶梯度与图像的卷积。
然而,据说“近似”行列式仅包含涉及二阶高斯滤波器的项。
的值为w
:
我的问题为什么像上面那样计算行列式,以及近似 Hessian 和 Hessian 矩阵之间的关系是什么。