格式塔心理学中的信息处理规则是否仍在计算机视觉中使用?

人工智能 机器学习 算法 计算机视觉
2021-10-21 20:34:24

几十年前,机器视觉方面的书籍和书籍,通过实施完形心理学的各种信息处理规则,在图像识别和视觉处理方面用很少的代码或特殊的硬件就取得了令人瞩目的成果。

今天是否正在使用或正在使用这些方法?这方面有进展吗?还是这个研究计划被放弃了?今天,我指的是 2016 年,而不是 1995 年或 2005 年。

1个回答

基于格式塔心理学的规则可以被视为最佳图像处理的“局部最小值”。其中一些可能非常有效,但难以扩展和改进,因为它们假设了某些可能无法很好概括的高级属性。

“如果它是圆形的,那么 90% 的时间它都是水果”

像神经网络这样的现代方法从另一个方向来解决这个问题,并尝试逐步建立这些高级属性。您可以说这些现代方法的目标是根据经验重新创建那些“假设”或“格式塔规则”的版本。这样,我们可以更有信心,我们没有使用局部最优方法。

“这是能够在 90% 的时间内准确识别水果的最小算法”

今天是否正在使用或正在使用这些方法?

是的,不仅仅是图像处理。如果您查看需要快速处理不明确的特定领域数据的任何行业,通常会有该领域的专家使用“手工制作”启发式设计的系统。这些方法的一个好处是“格式塔规则”在使用它的系统之外是可以理解的,因此更容易信任。

这方面有进展吗?还是这个研究计划被放弃了?

除了琐碎的案例外,在特定领域采用格式塔方法还需要专业知识。“图像专家”是一个昂贵且难以填补的角色。即便如此,您仍受限于该专家有效概括极其复杂问题的能力。在过去的几十年里,机器学习已经变得更容易使用、成本更低,并且正在慢慢取代所有那些“手工制作”的方法。

然而,当我们放开机器学习方法时,我们发现的一件有趣的事情是它们有时不符合我们以前的规则。为什么他们不同意,以及这对自动化和我们的心理偏见意味着什么,是人工智能中的一大悬而未决的问题。

您可能还对显着性地图和旨在可视化神经网络使用的一般规则的类似技术感兴趣:https ://en.wikipedia.org/wiki/Saliency_map

参考:

http://wayback.archive-it.org/219/20121229060421/http://www.cs.indiana.edu/~jwmills/ANALOG.NOTEBOOK/klm/klm.html

https://journals.sagepub.com/doi/pdf/10.1177/002029400403701001

https://maritime.org/doc/op1140/index.htm

https://airandspace.si.edu/stories/editorial/inventing-apollo-spaceflight-biomedical-sensors