在音乐理论中,八度音程是频率的间隔,从频率f频率2f. 例如,“高一个八度”意味着“频率的两倍”。表示为与频率成反比的波长,λ∝1f, 一个八度音程是从 aλ到12λ. 在 SIFT 论文的符号中,σ是尺度,类似于波长,因为它与高斯核的宽度成正比。
下采样只是为了减小图像大小,以便减少计算量。从论文(强调我的):
一旦处理了一个完整的八度音程,我们通过在每行和每列中每隔一个像素对具有两倍初始值的高斯图像(它将是堆栈顶部的 2 个图像)进行重新采样。相对于的采样精度与前一个八度音程的开始没有什么不同,而计算量大大减少。σσ
什么能够做到这一点?高斯函数具有另一个高斯函数作为其傅里叶变换,并且该函数的衰减速度比任何微分算子(如拉普拉斯算子)所能抵消的要快。的近似值滤波的有限幅度低通信号在近似意义上具有与成比例的频带限制。通过增加比例常数,可以使高于频带限制的部分信号的均方功率任意小。成比例的采样频率对滤波后的信号进行重新采样σ1σ1σ同时保持混叠误差任意小。一种方便的方法是不通过采样频率 \frac{\sigma_0}{\sigma} 对以采样频率 \frac{\sigma_0}{\sigma} 过滤的每个信号采样其中以采样频率采样的一些参考比例,而是通过采样频率:σσ0σσ012ceiling(log2(σ0σ))

图 1. 一个倍频程内所有频率的采样频率(红色)相同。缺点是对于某些尺度,采样频率高于该尺度的实际要求(蓝色)。是比例,是参考比例。σσ0
这将的值组合成多个八度音程,使得在每个八度音程内,采样频率是 2 的幂,确保每个空间样本的位置方便地与高一个八度音程的空间样本重合。缺点是一个八度音阶中所有音阶的采样频率必须基于八度音阶中包含的最低音阶来选择,以将混叠噪声保持在该音阶的可接受范围内。八度音阶中较高的音阶通常具有较少的混叠。σ