计算机视觉算法的精度

信息处理 图像处理 计算机视觉 参考请求
2022-01-10 20:52:08

假设任务是确定图像上的元素位置。首先非常重要的是正确检测对象,然后使用一些计算位置的算法(例如斑点分析)。一切都取决于多种因素(检测正确性、使用的算法等)

让我们假设我们已经校准图像并且知道校准给出的错误。有哪些方法可以可靠地计算计算机(和机器)视觉算法的精度?是否可以通过分析或仅通过实验和测试来完成?

该问题解决了我们检测元素位置以及其他计算机视觉问题的情况。

我想参考与计算机/机器视觉相关的问题,尤其是元素位置检测,并提出一些正确性计算,无论是分析方法还是实验方法,以显示这种精度。

也欢迎提出如何改进这个问题的建议。

2个回答

例如,Hartley & Zisserman建议在单应性估计之前使用预处理,因为采用直接矩阵求逆会导致巨大的错误或不稳定。这适用于使用矩阵求逆的任何数值方法。

特征检测算法通常使用兴趣点位置的亚像素近似。

大多数讨论数值方法的书籍也涉及它们的稳定性分析。

有时您需要做一些统计来分析估计器的精度和准确性(无论是最小二乘估计器还是最大似然估计器)。这在处理异常值的RANSAC等算法中很有用。您还想知道,估计的变换与您的数据的匹配程度如何,并可能丢弃过于不准确的结果。

在使用有限差分或进行一些过滤时,会进行轻微的高斯模糊以消除噪声,否则会导致二阶导数的巨大误差。

计算机视觉中的一些问题是不适定的。为了解决这些问题,需要一种正则化方法(例如 Tikchonov 正则化)。必要的示例包括计算各向异性扩散。

这并不能回答整个问题,但它解决了 OP 所询问的部分内容。

它只能通过实验来完成。要进行分析,需要有关算法应该返回什么的信息。但要知道这一点,您需要一个已知的始终正确的计算机视觉算法来进行比较(以及被测试图像的详细分析描述)。分析解决方案需要了解一个基本事实,该事实是分析性的,而不是根据具体情况手工生成的。但是我们没有分析方法来生成基本事实——这就是我们正在努力开发的。

鉴于它只能通过实验完成,您可能需要查看 google 学者。如果您在寻找人员位置,将会有很多文件专门用于定位一个人,或者一个人的头部或手部等部位。车位也会有很多专门的关注。其他对象只需要通用算法。