机器学习可以用来测量图片或实时相机中两个物体之间的距离吗?
这方面的一个例子是每个眼睛瞳孔中心之间的测量。
这个领域对我来说是全新的,所以任何建议和建议将不胜感激。
机器学习可以用来测量图片或实时相机中两个物体之间的距离吗?
这方面的一个例子是每个眼睛瞳孔中心之间的测量。
这个领域对我来说是全新的,所以任何建议和建议将不胜感激。
简短的回答是:是的,它可以。在您所描述的内容中,在概念上没有什么新的或特别的东西。这听起来像是一个标准的回归任务。现在你实际面临的问题是:你有数据吗?
如果您没有所需的数据,算法将无法学习眼睛之间的距离。它可以是受监督的标签(每张图像 1 个距离,这将是您的回归目标)、从深度图重建、多视图估计等。在给定适当的数据的情况下,您可以通过多种方式做到这一点。
人们非常关注算法,这很好。但仔细查看您的数据通常同样重要(如果不是更重要的话)。
现在,自动驾驶汽车文献就是一个很好的例子。您可以从这篇博文开始,浏览他们引用的论文:https ://towardsdatascience.com/vehicle-detection-and-distance-estimation-7acde48256e1
似乎还有一些关于您的眼睛示例的文献(https://arxiv.org/pdf/1806.10890.pdf,https://www.sciencedirect.com/science/article/pii/S0165027019301578 )所以浏览这些论文和他们使用的数据集可以引导我回答我的问题:这个任务有数据吗?
是的。有一个名为 OpenCV 的库可用于测量对象之间的距离。
要找出两个物体的距离,我们必须知道参考物体的尺寸。参考对象有两个重要的属性:
参考对象的尺寸将用于测量其他对象之间的距离。此外,我们首先需要计算“pixels-per-metric”比率,用于确定有多少像素“适合”给定的测量单位。
详细解释请看这个帖子: https ://www.pyimagesearch.com/2016/03/28/measuring-size-of-objects-in-an-image-with-opencv/