AIXI 与当前的人工智能研究有何关联?

人工智能 楷模 敏捷 爱西
2021-10-31 20:48:06

来自维基百科:

AIXI ['ai̯k͡siː] 是通用人工智能的理论数学形式。它结合了所罗门诺夫归纳法和顺序决策理论。AIXI 于 2000 年由 Marcus Hutter [1] 首次提出,以下结果在 Hutter 2005 年出版的《通用人工智能》一书中得到证明。 [2]

尽管不可计算,但近似值是可能的,例如AIXItl寻找 AIXI 的近似值可能是解决 AI 问题的客观方法。

AIXI真的是通用人工智能研究的大事吗?它可以被认为是该领域的核心概念吗?如果是这样,为什么我们没有更多关于这个主题的出版物(或者也许我们有但我不知道)?

4个回答

“当前的人工智能研究”是一个相当广泛的领域。从我所在的位置来看,在主要是 CS 领域,人们专注于狭隘的智能,这些智能可以在狭隘的任务上完成与经济相关的工作。(也就是说,预测组件何时会出现故障,预测用户会点击哪些广告,等等。)

对于这类工具,像 AIXI 这样的形式主义的普遍性是弱点而不是优势。你不需要使用理论上可以计算任何东西的人工智能,然后慢慢训练它专注于你想要的东西,而你可以直接塑造一个工具来反映你的任务。

我对 AGI 研究本身并不熟悉,但我的印象是 AIXI 在某种程度上是可行的最简单的想法——它承担了所有困难的部分并将其推向计算,所以它“只是一个工程挑战” 。(这是关于“找到 AIXI 的近似值”的一点。)然后问题就变成了,从 AIXI 开始并试图接近一条或多或少富有成效的研究路径,而不是从小而实用的东西开始,然后尝试建立?

我的印象是后者更为常见,但同样,我只看到这个空间的一个小角落。

AIXI 真的是通用人工智能研究的大事吗?

是的,这是对 AGI 的巨大理论贡献。AFAIK,这是为 AGI 建立理论框架或基础的最认真的尝试。类似的作品还有 Schmidhuber 的Gödel MachinesSOAR architecture

AIXI 是一个抽象的、非拟人化的 AGI 框架,它建立在强化学习领域之上,没有一些通常的假设(例如,没有马尔可夫和遍历性假设,这保证了代理可以轻松地从它所犯的任何错误中恢复过来)过去)。尽管 AIXI 的一些最优性已经被证明,但它是(图灵)不可计算的(它不能在计算机上运行),因此它的实际用处非常有限。尽管如此,在 Hutter 的《通用人工智能:基于算法概率的顺序决策》一书中(2005),其中 AIXI 的几个属性得到严格证明,还描述了 AIXI 的可计算但难以处理的版本 AIXItl。此外,在Joel Veness 等人的论文A Monte Carlo AIXI Approximation (2009) 中,介绍了一种可计算且易于处理的 AIXI 近似。因此,已经有一些尝试使 AIXI 变得实用。

文章什么是 AIXI?— 通用强化学习简介(2015 年),作者 Jan Leike,他是 AIXI 框架的开发和演变的贡献者之一,对 AIXI 代理进行了温和的介绍。另请参阅斯坦福哲学百科全书中的 AIXI 架构,以获得对 AIXI 的更温和的介绍。

它可以被认为是该领域的核心概念吗?

是的,AIXI 和相关研究的引入促进了 AGI 领域的发展。在 Hutter 于 2000 年在基于算法复杂性的通用人工智能理论中介绍了它之后,已经有几篇讨论和发表的论文。

例如,参见 Roman V. Yampolskiy 和 Joshua Fox 的论文“人工通用智能和人类心理模型”(2012 年)的第 7 节“超级智能示例”。另请参阅https://wiki.lesswrong.com/wiki/AIXI,其中包含有关与 AIXI 相关的一些问题的讨论,这些问题需要在未来的 AGI 框架中解决或可能避免。此外,另请参阅这篇文章和这篇文章。

如果是这样,为什么我们没有更多关于这个主题的出版物(或者也许我们有但我不知道)?

有几篇出版物,主要由 Marcus Hutter 和相关研究人员撰写。您可以在以下网页上查看 Marcus Hutter 的出版物:http ://www.hutter1.net/official/publ.htm 。

如果您有兴趣为这一理论做出贡献,有几种方法。如果你受过良好的数学教育,你可以尝试解决这里描述的一些问题(上面提到的 Hutter 2005 年的书中也提到了这些问题)。此外,您还可以为 AIXI 代理的新近似或现有近似的改进做出贡献。最后,您可以通过避免与 AIXI 框架相关的问题来构建新的 AGI 框架。另请参阅Hutter 推广的项目在尝试引入新框架之前(只要您有能力),最好也考虑一下 Gödel Machines 和相关工作。

我认为这个理论没有吸引更多的人可能是因为它技术性和数学性很强(所以不是很容易理解,除非你在强化学习、概率论等方面有非常扎实的背景)。我也认为大多数人(在人工智能社区)对理论不感兴趣,但他们主要以实际和有用的结果为指导。

AIXI 确实是一个概念框架。实际压缩环境的所有艰苦工作仍然存在。

进一步讨论 Matthew Graves 回答中提出的问题:鉴于我们目前表示复杂环境的能力水平有限,在我看来,是否从 AIXI 开始定义系统和工作(例如通过所谓的通用压缩方法)或从“底部”开始并尝试通过特定于域的方法解决单个域中的问题(您希望)随后可以抽象化以提供跨域压缩。

AIXI 很重要,我们已经看到的强化学习是完整复杂模型的一个较小的经典版本,需要量子计算才能实现。