使用广角镜头识别家居物体(图像处理、模式识别)?

信息处理 物体识别
2022-02-18 09:52:10

摄像头设置:我们在客厅设置了一些立体摄像头。即,监测室内环境。对于立体相机,使用广角镜头(3.5mm)来覆盖很大的体积。

离地面的高度约为2.8米。物体(如杯子、瓶子、电话)至少距离 3 米。例如,距离相机 3 米的物体 (75mmx102mm) 在相机图像中用 15x20px 表示。因此,图像在远场变得越来越小。

我有大约 30 种不同的物体需要识别。

我不使用深度信息,因为它不是那么准确。我只使用来自单个相机的 RGB 值。图像分辨率为 1360 x 1024 像素。

方法:1.点检测器/描述符,匹配(数据库中的一些模型,并逐个检查匹配)2.视觉世界包+SVM分类(5个对象类别)

我有使用 Haar-cascade 的经验,但我从未尝试过解决当前的问题。

我应该尝试调查哪些方法/方法?

先感谢您,

1个回答

我在这里分享你关于深度无用的假设。

基于点检测器的方法#1似乎也无用,因为您的参考(学习)图像和真实图片中对象的表示之间可能存在比例差异,而实际图片中的对象表示如此之大以至于点检测变得无用。信息不在同一级别。

因此,您只剩下方法 #2了,这听起来很合理,因为它也或多或少是对象检测基准中的最新技术。您可以通过使用具有真实(测试)图像中对象大小的训练图片集来提高系统的性能。

此外,您将仅使用现有关键点的描述符部分并将其应用于滑动窗口。由于 oyu 对对象的分辨率很差,我相信类似 SIFT 的描述符(例如,HoG)的性能会很差,而二进制描述符(LBP、BRISK、FREAK、ORB)可能会表现得更好(它们对像素的依赖性较小准确的分辨率)。

此外,如果您的对象非常不同,您可以尝试简单的图像关联(再次使用缩小到测试图片中对象实际大小的学习图像)。