摄像头设置:我们在客厅设置了一些立体摄像头。即,监测室内环境。对于立体相机,使用广角镜头(3.5mm)来覆盖很大的体积。
离地面的高度约为2.8米。物体(如杯子、瓶子、电话)至少距离 3 米。例如,距离相机 3 米的物体 (75mmx102mm) 在相机图像中用 15x20px 表示。因此,图像在远场变得越来越小。
我有大约 30 种不同的物体需要识别。
我不使用深度信息,因为它不是那么准确。我只使用来自单个相机的 RGB 值。图像分辨率为 1360 x 1024 像素。
方法:1.点检测器/描述符,匹配(数据库中的一些模型,并逐个检查匹配)2.视觉世界包+SVM分类(5个对象类别)
我有使用 Haar-cascade 的经验,但我从未尝试过解决当前的问题。
我应该尝试调查哪些方法/方法?
先感谢您,