金字塔匹配内核:如何在数据点周围拟合网格?

信息处理 计算机视觉 物体识别 分类
2022-02-12 08:31:08

我打算使用 Pyramid Match Kernel 方法从深度图像中进行对象识别:我要提取一组特征向量xRd对于每个对象实例,然后我想使用Grauman 论文中http://jmlr.csail.mit.edu/papers/volume8/grauman07a/grauman07a.pdf中所述的 Pyramid Match Kernel,以便使用一组功能带有 SVM 分类器的每个对象的向量。

我有一个问题要理解我们应该如何围绕数据点构建 bin。论文给出了以下定义:

在此处输入图像描述

这里的“向量间”距离是什么意思?我想到以下几点:我们考虑所有xi每个值XS. 然后我们找到两个距离最小的向量d,(唯一的)然后缩放所有向量1/d. 然后D是向量元素的最大绝对值S.

这就是作者在这里的意思吗?如果我们要测试一个新的向量怎么办y,我们应该如何扩展它?

1个回答

不,不是这样。看看你引用的最后一句话:

...这可以通过将数据缩放到某种精度并截断为整数值来强制执行。

所以这正是你要做的。取所有特征向量,将它们乘以 1000(或其他因子),然后截断为整数。那么任何两个唯一特征向量之间的距离必须 >= 1。如果你有一个新向量 y,那么你将它乘以相同的因子并截断。