我正在尝试实现一个框检测算法。在我的流程中,我从图像变形开始,以模拟包含盒子的架子的正面视图(假设盒子在那个隔间里是直的)。然后,这有助于过滤提取的边缘(例如 Canny)以仅保持严格的水平和垂直边缘。在那里我得到这样的东西:
作为一个人,很容易说盒子所在的位置几乎是一个矩形,甚至两个矩形,一个是盒子盖。这不是因为您在背景中看到了盒子图像,即使只有边缘也很明显。这是仅边缘的图像:
我试图想出某种运算符来扫描所有图像并返回最合适的矩形。
这里最合适的意思是:
- 矩形模型在其边缘有大量相对数量的红色像素(比如说 80% 左右) 互相关可能吗?
- 长宽比应大于0.5。
- (可选)矩形的内部应该有 80% 左右是空的
矩形模型也可能有一个容差参数,其中+/-容差区域中的红色像素也被认为属于正在测试的矩形。
由于在所有不同的图像位置扫描所有不同的矩形大小在计算上是不现实的,解决这个问题的有效方法是什么?我的直觉对我大喊“卷积”,但我不确定如何为这种情况建模。
编辑:这是原始图像