灵活性和效率之间是否存在权衡?

人工智能 人工智能设计 敏捷 窄艾
2021-11-03 22:35:46

一个“通用智能”可能能够学习很多不同的东西,但拥有能力并不等于真正拥有它。“AGI”必须学习……而学习过程可能需要时间。如果你想让 AGI 开车或下围棋,你必须找到某种“教”它的方法。请记住,我们从未构建过 AGI,因此我们不知道训练过程可以持续多长时间,但假设悲观估计是安全的。

将其与“狭义情报”进行对比。狭隘的人工智能已经知道如何开车或下围棋。它已被编程为在一项特定任务中非常出色。您无需担心训练机器,因为它已经过预训练。

“一般智能”似乎比“狭义智能”更灵活。你可以买一个 AGI,让它开着车围棋。如果你愿意做更多的训练,你甚至可以教它一个新技巧:如何烤蛋糕我不必担心会出现意想不到的任务,因为只要有足够的训练时间,AGI最终会弄清楚如何去做。不过我得等很久

“狭义智能”似乎在其分配的任务中更有效,因为它是专门为该任务而编程的。它确切地知道该做什么,并且不必浪费时间“学习”(不像我们这里的 AGI 伙伴)。与其购买一个 AGI 来糟糕地处理一堆不同的任务,我宁愿购买一堆专门的窄 AI。Narrow AI #1 开车,Narrow AI #2 下围棋,Narrow AI #3 烤蛋糕等等。话虽如此,这是一个非常脆弱的方法,因为如果出现一些意想不到的任务,我的狭窄 AI 都无法来处理它。不过我愿意接受这个风险。

我的“想法”正确吗?灵活性(AGI)和效率(狭义的人工智能)之间是否存在权衡,就像我上面刚刚描述的那样?或者,AGI 在理论上是否可能既灵活又高效?

3个回答

我们在这个问题上得到的最清楚的结果是“没有免费的午餐”定理基本上,为了让系统在特定任务上表现更好,你必须降低它在其他任务上的性能,因此需要在灵活性和效率之间进行权衡。

但是对于更广泛的问题,或者您的想法是否正确,我认为更仔细地研究一下您所说的“狭义智力”是什么是值得的。我们拥有的能够玩围棋和驾驶汽车的人工智能系统并没有出现能够做这些事情;他们通过大量的训练示例和精心挑选的反映问题领域的架构慢慢学会了如何。

也就是说,“神经网络”作为一种方法论似乎以一种有意义的方式“普遍”;可以想象,可以通过解决元学习问题(即学习最适合特定问题的架构,同时从训练数据中学习该问题的权重)来形成通用智能。

即使在这种情况下,仍然需要在灵活性和效率之间进行权衡;允许改变其架构的通用智能将能够解决许多不同的问题,但需要一些时间来发现它面临的问题。锁定在特定架构中的智能将在架构非常适合的问题上表现良好(比一般架构更好,因为它不需要发现),但在它不太适合的其他问题上表现不佳。

正如马修格雷夫斯在另一个答案中解释的那样,没有免费的午餐定理证实了灵活性 - 效率的权衡。然而,这个定理描述了你有一组完全独立的任务的情况。这通常不成立,因为许多不同的问题在它们的核心是相同的,或者至少有一些重叠。然后你可以做一些叫做“迁移学习”的事情,这意味着通过训练来解决一个任务,你也会学到一些关于解决另一个任务(或者可能是多个不同的任务)的知识。

例如在Rusu 等人的Policy Distillation中。他们设法将来自不同专家网络的知识“提炼”成一个通用网络,最终胜过每一位专家。专家接受特定任务的培训,而通才从这些“老师”那里学习最终政策。

看起来是这样。在数字计算机和模拟计算机之间的差异中可以看到一个示例,尽管与 AI 无关。我们今天所认为的“计算机”几乎都是具有冯诺依曼架构的数字计算机。那是因为这些东西是如此通用,以至于它们可以很容易地被编程来做任何事情。但是模拟计算机可以(或可以,早在 60 年代左右)比数字计算机更快地解决某些类型的问题。但正是由于缺乏灵活性,它们失宠了。没有人愿意用运算放大器和比较器手工连接电路来解决y