HOG(梯度直方图)检测器训练的正样本的最小大小

信息处理 图像处理 计算机视觉 物体识别 检测
2022-02-13 12:10:09

我将使用 SVMLight 库训练一个 HOG 检测器来检测物体(行人头部)。但我的问题与实施无关。

我想知道如何收集样本。我必须使用一些视频,它们的尺寸为 1624x1234px。行人头部或多或少有 20x20px 的边界框。

20x20 像素对于正确的 HOG 特征提取是否太小?还是适合训练?的,它必须是 2 所以.. 36 像素?

那么检测呢?我可以缩小视频吗?据我所知,检测是在训练样本上完成的,然后可能会缩小。因此,如果我用 20x20px 训练检测器,我可以检测到最小为 20x20 的对象,然后如果我将图像缩小到一半,我可以检测到 40x40 的对象,但不能检测到 10x10(我应该放大,但噪音会是一个问题)。

那么,计算时间呢?

任何提示将不胜感激..

2个回答

您应该使用 2 的幂的元素,以便轻松快速地计算。我会说,从 8x8 开始,所以你只能按比例放大。如果您只需要查看此图像的某些部分,则可以裁剪原始图像。

理想情况下,您的训练大小应该是 HOG 单元大小的倍数。因此,如果您的单元格是 8x8,那么您的训练尺寸应该是 16x16 或 24x24。不,您无法检测到小于您的训练大小的对象。