什么事件可以证实我们已经实施了 AGI 系统?

人工智能 哲学 敏捷 智力测验
2021-10-24 00:07:52

我正在收听关于 AGI 主题的播客,一位嘉宾提出如果要发生强大的音乐生成,这将是机器“真正”智能的标志,因为创作音乐需要多少创造性能力(即使对于人类)。

这让我想知道,还有哪些事件/里程碑可以让比我更涉足该领域的人相信我们可能已经实施了 AGI(或“高度智能”系统)?

当然,这个问题的答案取决于 AGI 的定义,但是你可以选择一个合理的 AGI 定义来回答这个问题。

因此,例如,其中一些里程碑或事件可能是:

  • 一般对话
  • 全自动驾驶汽车(无需人工干预)
  • 音乐生成
  • 类似于 AlphaGo 的东西
  • 高水平阅读/理解

什么特别的事件会让你相信我们已经在机器中达到了高水平的智能?

它不必是我列出的任何事件。

4个回答

这是一个很难回答的问题,因为——首先——我们仍然不知道“智能”是什么意思。这有点像最高法院大法官波特斯图尔特拒绝定义“色情”,而是说 [...]当我看到它时我就知道了AGI 将是相同的。

没有单一的事件(几乎按照定义),因为那不是普遍的。好的,我们的机器可以在国际象棋和围棋中击败最优秀的人类棋手,这两种游戏几个世纪以来都被视为智力的象征。但是他们可以点外卖披萨吗?他们甚至明白自己在做什么吗?或者,更根本的是,知道它们在上一句中的含义吗?

为了让机器表现出不平凡的智能行为,我希望它能够与其环境交互(这是更多的社交智能,在很多人工智能中似乎都被忽视了)。我希望它知道它在做什么/说什么。如果我与一个真正理解它在说什么的聊天机器人进行对话(并且可以解释为什么它会得出某些结论),那将表明我们正在接近 AGI。所以图灵离我们并不遥远,尽管现在它更多地是通过烟雾和镜子而不是“真正的”智能来实现的。

理解故事:能够以明智的方式完成部分故事,推断和推断角色的动机,能够说出角色以特定方式行事的原因。对我来说,这比在国际象棋上击败某人或解决复杂的方程更好地表明了 AGI。好笑的笑话;以明智的方式打破讲故事的规则。

写故事:NaNoGenMo是一个好主意,并且抛出了很多非常有创意的东西,但是你想读多少由此产生的小说而不是人类撰写的书籍?一旦该过程产生了畅销书(基于故事的质量),那么我们可能会越来越接近 AGI。

创作音乐:当然,您已经可以使用 ML 算法生成体面的音乐。与故事类似,难点在于选择背后的意图。如果选择是随机的(或基于学习的概率),那纯粹是模仿。AGI 应该能够做的不止这些。给它一个歌词并要求它围绕它创作一部歌剧。这样做 100 次,当超过 70-80 部由此产生的歌剧实际上是人们想听的不错的音乐时,那就太好了。

自动驾驶汽车?这并不比在人群中走来走去不撞到人也不被公共汽车碾过更聪明(但更性感!)。在我看来,如果您可以将文学翻译成外语并且阅读它的人实际上最终会喜欢它(而不是想知道是谁翻译了那些垃圾),那么这更像是一种智慧的标志。

我们需要注意的一个方面是拟人化。Weizenbaum 的ELIZA获得了更多的关注,因为它的用户试图理解他们所进行的对话并建立了 Eliza 的心理模型,而这显然不存在于屏幕的另一侧。我希望看到一些关于 AGI 正在做的事情的意图的真实证据,而不是因为它以我能够解释的方式行事而将其归于智能。

  • 对我来说,它可能是一个自动机,可以在没有精确定义参数的情况下充分解决人类从事的各种活动的问题。

我使用这个指标是因为这似乎是人类所做的——即使我们无法在数学上对其进行分解,也能做出具有足够实用性的决策。

  • 这可能需要定义要充分解决的问题的能力。这可以理解为创造力的一个要素。

在这种情况下,一切要么是拼图,要么是游戏,取决于它是否涉及多个代理。此类问题可能是平凡的,例如打开与标准门不同的门,或者识别新问题。

定义要解决的问题触及了奥利弗关于意向性的观点。 (我不同意 Oliver 的观点是,智力不是从根本上定义的——在对该主题进行大量研究之后,它似乎是衡量环境中适应度的指标,环境可以是任何东西。术语本身的词源强烈表明在备选方案之间进行选择的能力,因此是决策制定的功能,由效用与其他决策制定者衡量。)

  • 这样的机制可以是“中国房间”,因为人类意义上的意识、感受质和自我意识本身并不是一般智力的要求。

关于艺术:

我不相信艺术成就将是对艺术的肯定标志 b/c 反应是主观的,而艺术的过程是达尔文式的——艺术家必须成倍地“失败”才能让一个艺术家“成功”。人类可能归于“天才”的作品可以通过遗传算法过程创造出来,其中时间和记忆是唯一的限制因素。[参见:巴别图书馆] 仅就作品的长度而言,创作一部开创性的交响乐是很困难的,但大部分流行音乐已经通过算法生成,而狭隘的智能算法已经在产生合法的抽象视觉艺术。

计算机擅长数学,而艺术天生就是数学。这在音乐中是最容易辨别的,它只是频率和时间特征的组合,会在听众中产生影响。这适用于视觉艺术,它取决于平衡(平衡)、构图(空间关系)和阴影或颜色(频率)。如果我们相信博尔赫斯,那么即使是文学本身也是数学的(想想“叙事弧”以及关于人物和事件的集合论和组合学。)

此外,在呈现给观众之前,没有人真正知道什么会“起作用”,所以什么构成伟大的艺术通常取决于什么会随着时间的推移而持续存在并保持或变得相关。(这可能会起起落落——莎士比亚并不总是占据他在英国食物链顶端的位置!作者的伟大很大程度上取决于对他作品的解释,尤其是因为戏剧艺术本质上是解释性的,在感觉这是表演者的任务。)

我不想直接回答这个问题,因为目前的答案将主要基于意见。相反,我将尝试提供一些信息,以便我们将来可以更准确地预测何时创建 AGI)。

通用人工智能 (AGI) 通常被定义为具有通用智能 (GI) 的人工智能 (AI),而不是只能解决非常有限的一组任务的 AI。人类具有通用智能,因为我们可以解决许多不同的任务,而无需再次进行预编程。可以说,地球上还有许多其他的地理标志。例如,所有哺乳动物也应该被视为通用智能,因为它们可以解决许多任务,而这些任务对于计算机来说通常是非常困难的(例如视觉、对象操作、交互等)。

某些 GIs 比其他人更好地执行某些任务。例如,豹子可以比人类更熟练地爬树。或者人类可以比任何其他哺乳动物更容易解决抽象问题。在任何情况下,系统都需要将某些相关属性视为通用智能。

  • 自治
  • 适应
  • 相互作用
  • 持续学习
  • 创造力

考虑一只从未过河的幼狮。通过看着她的母狮,幼崽试图模仿她的母亲,也可以过河。例如,观看此视频Lion Family Tries to Cross River | 骄傲的诞生有人可能会争辩说,所有狮子在出生时就拥有这种技能,编码在它们的 DNA 中,然后可以在以后完全发育。然而,这不是重点。关键是,在某种程度上,它们具有上述特性。

有人可能会争辩说,某些当前的 AI 在某种程度上已经具备其中的一些属性。例如,有持续学习系统(即使它们还不是很好)。然而,这些系统真的拥有自主权吗?应该有一个可测量的自治(以及所有其他属性)的精确定义,以便我们可以将计算机与其他地理信息系统进行比较。我不知道这些属性的任何精确定义。事实上,AGI 领域确实处于早期阶段,整体上从事的人并不多,但人们更多地致力于特定问题或试图实现某些特性(例如,有人试图开发持续学习系统,而不真正关心它们是否表现出任何自主性)。

有一些智力测试可以用来检测一般智力。最著名的是图灵测试(TT)。有人声称TT只测试受试者的会话能力。考虑到还有许多其他任务或技能没有在 TT 中测试,他们怎么可能真的错了?

因此,为了正式检测 AGI,需要回答几个问题。

  1. AGI 必须且充分地需要具备哪些属性?
  2. 我们如何才能精确地定义必要和充分的属性,以便它们是可测量的,因此我们可以将 AGI 与其他 GI 进行比较?
  3. 我们如何衡量这些属性以及 AGI 在将它们应用于解决任务时的性能?

朝着这个方向发展的一篇论文是Universal Intelligence: A Definition of Machine Intelligence但是,似乎对这些话题感兴趣的人并不多。目前,人们主要对开发窄(或弱)人工智能感兴趣,即只解决特定问题的人工智能,这似乎比开发整个 AGI 更容易,因为大多数人对盈利的结果感兴趣并且有实用程序(又名现金统治着我周围的一切)。

因此,需要对一般智力和智力测试进行正式定义,以取得一些科学进步。但是,一旦创建了 AGI,每个人都可能会认为它是一种通用智能,而不需要任何正式的智能测试。(人们通常擅长识别熟悉的特征)。最后一个问题是,是否会创建 AGI?如果您对此问题和相关问题感兴趣,请查看文森特 C. Müller 和 Nick Bostrom 撰写的论文《人工智能的未来进展:专家意见调查》(2014 年)。

这是一个试探性的答案,我可能会在某个时间点回到它。正如@nbro 提到的,这个问题似乎是基于意见的,所以我的回答也只是我的意见

如果 AGI 的意思是“超级智能”,那么以下任何结果都应该足以让任何人相信它比他/她/代词“更聪明”:

  1. 解决重要的数学问题(最著名的例子是千年问题科拉茨猜想哥德巴赫猜想。(推论:破解所有已知的加密方案)
  2. 建立一个新的“系统”来取代ZFC作为数学的新基础。
  3. 自然科学的新发现(物理学、化学、生物学……)

(1)作为一个标准有点可疑:至少使用现代技术,自动定理证明要么只是“符号推送”,要么需要太多的人工干预(在设计/构造中解决特定问题)以至于很难把它想象成传统意义上的“聪明”。我们已经有几个案例,其中自动定理证明器解决了大问题(四色定理是最值得注意的)。重点是,即使我们使用类似于我们已经拥有的方法来实现这一点,人们也可能会拒绝称其为“智能”。

(2) 很难想象曾经是合理的。就这种“AGI 事物”在“做数学”的系统上实现的程度而言,想象一个可以超越自身以识别新的、“更好”的数学系统的系统是不寻常的。作为一个类比,它可能就像一个形式系统,试图在哥德尔意义上证明自己的一致性

但是这个类比很弱,我看不出有什么强烈/严格的理由怀疑 AGI 可以发现一个新的公理系统。甚至有人可能会认为,AGI 可以从“自下而上”创建一个新系统,就像弦理论是从“自下而上”构建以“解释”相对论和粒子物理学一样。也许那时我们可以对诸如连续统假设之类的问题有“适当的解决方案”,就像平行假设如何被丢弃以让位于非欧几里得几何一样。但我也怀疑是否会有关于数学本身的“最终决定”,所以它现在只是一个有趣的想法。

(3) 也令人怀疑它是否会成为现实。自然科学的研究需要在世界上的物理存在,而不仅仅是寻求“数学方程式中的美”,这对于 AGI 来说是不寻常的。话虽如此,AGI 可以有摄像头和其他传感器来解释自然世界,所以我认为这并不是绝对不可能的事情。


如果你所说的 AGI 是指“人性”,那么我认为没有任何单一的结果可以同时让世界上的每个人都相信它是 AGI。也许这种“让世界相信‘我是 AGI’的工作”可以在人与人的基础上完成,因为 AGI 需要与每个人互动并慢慢建立一定程度的信任。

在这种解释下,不可能有描述 AGI 的完整列表,所以下面只是我自己的列表,我认为类人 AGI 可能能够做的事情。

  • 创造和诠释艺术。
  • 有常识。
  • 要有“创意”
  • 进行有意义的对话,理解他人并有意义。
  • 能够进行/接受精神分析;民间心理学的理解。
  • 存在于具有社会/环境适宜性的物理表现形式(如机器人)中。

上述标准的主要问题是它们都是主观的。就像我上面说的,这套标准可能会根据具体情况而定


这些标准似乎是最重要的,但同时这些术语的验证定义在认知上很棘手,所以我将它们保持开放。

  • 学习(一个物种是否随着时间的推移在学习它的环境?)
  • 自我复制(模因/病毒是否智能?)
  • 自我意识(图像的背叛是自我意识的吗?)