对于我正在从事的项目,我希望能够检测视频片段中的唯一图标/条形码。假设框架中有 10 个人,每个人都穿着一件带有相似但唯一标识符(类似于条形码)的 T 恤,程序将检测每个唯一标识符。
以下是我现在正在使用的三个选项以及相关的缺点:
- 使用蛮力特征匹配(SURF、SIFT 或 ORB) - 不确定在人们移动和旋转时这在现实世界场景中的准确度如何,因此如果标识符非常相似,这仍然可以达到良好的准确度吗?
- 训练微型 YOLO 模型。现在这似乎是一个不错的选择,但不是很可扩展,而且似乎有一个更简单的解决方案
- 简单的模板匹配 - 由于视角、大小和角度的变化,这不是一个很好的选择
任何建议将不胜感激!
编辑
我想为上下文添加一些图像。这个想法是每个人都会有一个标志,周围有一个独特的二进制模式。见下图:
正如你所看到的,由于周围的条纹,两者相似但不相同。
我正在对其应用 Adoptive Gaussian Blur 并获得类似“条形码”的图像,这些图像明显不同
现在,在我看来,正常的 SURF 匹配至少不能可靠地识别两个图像中的细微差别








