什么样的图像/对象最容易被神经网络检测到?

数据挖掘 图像识别
2022-03-08 16:44:48

我需要设计一个应该被神经网络检测到的标记图像。我知道仅仅检测图像并不是一项复杂的任务,这可以单独使用 OpenCV 完成。然而,探测器也应该在纯粹的可见性条件下工作(低光、失焦、磨损/部分损坏、仅形成图像的一小部分等)。标记图像周围的背景只是真实的世界,很难预测它可能在那里。

什么样的图像最容易让神经网络处理?最重要的

  • 它是否应该像字母或路标一样具有鲜明的对比,或者颜色渐变可能会更好?
  • 将重复图案(如人字形框架)作为对象的一部分有助于或更好地使标签的每一块都独一无二?

我知道神经网络主要用于人类和马等“现实世界”图像,但我不确定它们是否是更好的对象,或者只是让它们被识别更令人印象深刻。

另一方面,人类为了识别它们而故意制造的物体(如路标)大多使用鲜明的对比。我不记得有任何颜色渐变的道路或其他标志,但有时会使用像人字形框架这样的重复图案。另一方面,带有颜色渐变的路感器制造起来更加复杂,也许在它们最初发明时根本不存在该技术。

在“嘈杂的输入”条件下,神经网络最容易识别哪种对象是否有共识?

1个回答

您正在描述强大的对象检测领域。

这在很大程度上取决于数据和模型的细节。与夜间仅在路灯下寻找钥匙的人类似,最强大的物体检测研究与自动驾驶有关。

最简单的答案可能是训练数据中的样本之外的东西。如果标记对象是 100% 合成的,模型会很快学习它,因为不会与其他输入混淆。同样,100% 合成的定义取决于训练集。