在阅读了最著名的基于 CNN 的物体检测方法:YOLO、YOLO 9000、r-cnn、faster r-cnn 等之后,我想知道是否有一种架构可以计算检测后到障碍物的距离?
谢谢你。
在阅读了最著名的基于 CNN 的物体检测方法:YOLO、YOLO 9000、r-cnn、faster r-cnn 等之后,我想知道是否有一种架构可以计算检测后到障碍物的距离?
谢谢你。
实际上,我不认为这是一个可以仅从图像中解决的问题,因为它可能是一个非常接近的小物体或非常远的大物体。据我所知,自动驾驶汽车为此使用传感器。根据我在此处找到的内容,您需要对象的实际高度才能从一张图像中计算出来。
我强烈怀疑您也可以通过拥有两张图像然后使用两个相机之间的距离以及勾股定理来计算距离来计算距离。但这只是猜测。
据我所知,目前还没有直接的架构可以解决这个问题,但我认为这对 CNN 来说不是一个大问题。对于您的训练集,您可以选择直接训练以估计距离,如果它始终是同一个对象,或者如果有多个对象并且您想要检测它们,您可以将距离添加到损失函数中。但是,您需要调整这两个不同目标之间的权重,如果您不知道这些对象检测器是如何工作的,那么如何做到这一点可能并不明显。
编辑:根据您的其他信息:
这主要取决于您可用的训练数据,如果您有相机和车辆之间的历史距离,那么我认为像我提议的系统会工作得更好,因为它允许您端到端地训练网络。
我可以想象你只有边界框,那么你可能需要找到一个不同的解决方案,或者通过近似汽车的大小(例如通过识别汽车的类型)并使用预测的边界框的大小作为指标它到底有多远。由于不同类型的失真,不同的相机可能会使这变得棘手。