为什么神经网络会成为“具身人工智能”的一个特别好的框架?

人工智能 神经网络 类人 具身认知
2021-11-01 05:45:06

有一种说法是,大脑的认知能力与其处理感觉运动信息的方式密切相关,并且在这种或类似的意义上,我们的智力是“体现”的。让我们假设,为了争论,这个说法是正确的(你可能认为这个说法太模糊,甚至没有资格被认为是正确的,它“甚至不是错误的”。如果是这样,我很想听听你的充实方式以这样一种方式提出声明,使其足够具体,可以判断为真或假)。

然后,由于可以说至少在我们进化的时间顺序上,我们的大多数高级认知能力都在我们大脑处理感觉运动信息的方式之后,这就提出了一个问题:是什么让我们的大脑运作方式特别适合用于处理感觉运动信息?是什么让我们的大脑结构特别适合作为体内的信息处理单元?

这是我的第一个问题。而我希望得到的答案超越了我们的大脑是如此强大和充满活力,它对任何任务都非常有用,对于处理感觉运动信息也是如此”。

我的第二个问题基本相同,但是,我想问的是神经网络,而不是人脑。神经网络的哪些特性使其特别适合处理由身体产生的信息?

以下是人们认为神经网络强大的一些原因:

  • 通用逼近定理(FFNN)
  • 他们学习和自我组织的能力
  • 对信息局部退化的鲁棒性
  • 他们抽象/粗粒度/卷积特征等的能力。

虽然我看到在进化为具体人工智能选择其最喜欢的模型时这些是真正的优势,但它们(或它们的组合)似乎都不是神经网络所独有的。所以,他们没有为我的问题提供令人满意的答案。

是什么让神经网络比在我们的头脑中放置一个字面图灵机或任何其他能够进行通用计算的结构更适合体现人工智能的结构?

例如,我真的不明白神经网络如何成为处理几何信息的特别自然的选择。但是对于感觉运动信息,几何信息非常重要,不是吗?

3个回答

在我看来,神经网络和大脑强大的根本原因在于它们创建了数据或世界的层次模型。如果你问为什么这会让它们变得强大,那么,这就是世界的结构。如果你被狼跟踪,它的上颚不会正面攻击你,而它的下颚会从背后攻击你。如果您想通过可行的计算努力来应对威胁,则必须将狼视为一个实体。从输入的原始位和字节提供这些类型的实体或概念是分层表示的作用。

现在,这对于感官信息来说是相当直观的:睫毛、虹膜、眉毛组成眼睛,眼睛、鼻子和嘴巴组成脸等等。不太明显的是,电机控制的工作方式完全相同!只能反过来。如果你想抬起你的手臂,你只需抬起它。但要让你的大脑真正实现这一动作,必须将高级命令分解为涉及的每一块肌肉的精确信号。这是通过向下传播命令来完成的。

在大脑中,这两种功能密切相关。你使用持续的感觉反馈来调整你的运动控制,在许多情况下,如果你没有关于你的身体正在做什么来改变那个流的额外信息,你将无法将你的感觉数据流整合成一个连贯的表示。数据。扫视就是一个很好的例子。

当然这并不意味着我们的认知功能依赖于感觉运动信息的处理。如果无法实现纯粹的思考机器,我会感到惊讶。然而,这个“具身智能假设”的一个特定版本在我看来似乎是合理的:

通过无监督学习创建高级认知概念是一个非常困难的问题。创建高级电机表示可能要容易得多。原因是有更多即时有用的反馈。我一直在考虑如何为学习认知概念的层次结构提供一个脚手架,我可以想象的一件事是,高级认知概念基本上与运动概念搭便车。想一想哑剧可以仅通过动作来表达什么。

BlindKungFuMaster 的回答涉及感知和身体控制的层次性,所以我将把它放在一边,尝试回答为什么进化会使用神经网络进行动物具身认知,然后尝试回答其他人造动物的机器人是否会使用相同的系统。

重要的是要关注整个动物,而不仅仅是人类,因为这就是进化的运作方式——就像著名的 John Gall 名言:

一个工作的复杂系统总是被发现是从一个工作的简单系统演变而来的。

如果你可以构建一个包含五个运动部件来进行感觉运动控制的系统,但它需要所有五个部件都工作才能发挥作用,那么除非在最罕见的情况下,进化才能构建那个系统。

相反,进化所做的是慢慢扩展功能系统。如果将一个光敏细胞连接到一个肌肉细胞会使有机体更有可能存活,那么您就可以在不发明任何新类型细胞的情况下添加第二层,因为您已经拥有信息处理连接器。

神经网络便于进化,因为它们的组织与问题的层次性质相匹配,并且到处都使用相同类型的单元。您所需要的只是接收信号的树突,一种计算阈值并在接收到的信号较高时触发的方法,可以到达其他细胞的轴突,然后在轴突末端分支以用作倍增器。只需添加更多单元格,即可任意扩展网络的深度和广度。

神经网络便于人工感觉运动控制,因为它们可以让你在记忆中访问大量中间值。它们也很方便,原因与进化发现它们方便的原因相同——我们可以说我们期望机器人控制的结构是什么样的,提供训练数据,然后最终有一个可以工作的机器人。

但是有很多机器人的控制系统是设计而不是学习的。举一个非常简单的例子,我们可以在恒温器问题上使用机器学习,来了解什么温度需要打开加热器,以及什么温度需要打开空调。但这将是额外的工作,并且与提前设计最佳控制系统相比,系统的鲁棒性较差。

在控制理论中,有一个称为自适应控制的概念,其中控制系统的状态空间参数之一是系统的属性。例如,想象一颗卫星;通常我们认为系统的状态空间是卫星在三个维度上的位置和速度,所以总共有六个坐标。然后有一组微分方程描述了卫星如何随时间移动,以及如果我们使用卫星上的执行器来改变它的速度会发生什么。

但是这些微分方程的一部分是卫星的惯性。也就是说,我们需要消耗多少燃料以及它将如何影响卫星的旋转和平移,这取决于卫星的重量所在的位置。这可能会随着时间的推移而改变,因为燃料被消耗或者如果开始时没有正确测量。自适应控制向系统添加新状态以跟踪惯性,然后同时更新其对惯性的估计,并使用该估计来规划移动到所需位置所需的控制。

你可以想象用神经网络解决这个问题,但我们可以很容易地从第一原理计算出最优解。在这种情况下,我们不需要基于神经网络的控制,但最终结果从外部看起来会像它。

是什么让我们的大脑运作方式特别适合处理感觉运动信息?

它们是感觉运动受体的延伸,功能可能意味着大脑进行的数百种特定计算中的任何一种,但每个基本上都是由基本细胞类型的变体组成的电路,具有基本计算,即神经元.

是什么让我们的大脑结构特别适合作为体内的信息处理单元?

我认为考虑内部和外部处理没有帮助,而是沿着束和节点进行处理,(更接近受体,可用于意识等)但抛开这种区别,大脑结构适合处理信息(同样,您所指的信息处理的哪个方面尚不清楚),因为从它的演变中衍生出的专门计算的数量。

神经网络的哪些特性使其特别适合处理由身体产生的信息?

神经网络类似于大脑的某些部分/电路,主要是如何根据一组输入及其频率集成信息,它们的类型有多种和细微差别,但它们都有输入,在身体的情况下是感觉的/中间神经元单元和输出;神经元传入和运动神经元。