图像识别和方向检测
人工智能
神经网络
图像识别
2021-10-27 21:11:40
1个回答
这是一个非常微不足道的问题,使用 NN 将是矫枉过正。您使用的符号(三角形)有问题,因为它在 3 个不同的位置(旋转 0°、120° 和 240°)看起来完全相同。
最简单的实现是使用 2 个具有固定距离的可区分点。为了区分它们,您可以对它们进行颜色编码或赋予它们不同的尺寸。使用模式匹配算法在您的图片中应该很容易识别这两个点。一旦有了 2 个点,您就可以计算它们之间的向量,然后可以计算向量的方向,这基本上可以告诉您放置符号的整个对象的方向。
编辑 - 回答第一条评论:
无论您使用什么符号,基本思想都是相同的。在“L”的情况下,您的 2 点将是两条线的结尾。您可以轻松找到符号,计算两个点之间的矢量,并使用它来计算使用该矢量的方向。这种方法可用于每个不具有径向对称性的符号。您始终可以在此符号中定义 2 个点并应用所描述的方法。
神经网络过度杀伤的原因是问题的简单性。神经网络主要用于解决人类容易解决但很难用简单算法实现的问题。诸如对图像进行分类、识别手写或扭曲的字母等任务。但是您的问题可以通过简单的算法轻松解决,因此不需要 NN 的复杂性。
这并不意味着您的任务不能用 NN 来实现。实际上,了解更多关于 NN 的信息可能是一个非常有趣的项目。我会说你最好的选择是将它实现为 CNN,因为这种类型的 NN 擅长检测图像中的特征,比如符号的方向。如果您想了解有关 CNN 的更多信息,我可以推荐斯坦福大学的这门课程。
对于现实世界的应用程序,无需使用 NN 采取复杂的路线。我建议的算法可以用几十行代码来实现,并且应该非常健壮。
其它你可能感兴趣的问题