训练 AI 以超人的性能玩星际争霸 2?

数据挖掘 机器学习 计算机视觉 音频识别 nlp
2022-02-26 04:03:40

我对研究具有挑战性的 AI 问题很感兴趣,并且在阅读了 DeepMind 和 Blizzard 的这篇文章 ( https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/ ) ,我认为开发一个强大的 AI 能够学习以超人的性能水平玩星际争霸 2(无需先验知识或人类硬编码的启发式算法)将意味着 AI 研究的巨大突破。

当然我知道这是一个极具挑战性的问题,我绝不会假装自己是解决它的人,但我认为这是一个值得挑战的挑战,因为所需决策的复杂性更接近现实世界,所以这迫使你想出更强大、更通用的 AI 算法,这些算法可能会应用于其他领域。

例如,玩星际争霸 2 的 AI 必须能够观看屏幕、识别物体、位置、识别移动的单位及其轨迹、更新其当前对世界的了解、做出预测、做出决定、有短期和长期术语目标,听声音(因为游戏包含声音),理解自然语言(阅读和理解屏幕上出现的文字描述),它可能还应该被赋予某种注意力机制以能够集中注意力到屏幕的某些感兴趣区域等。因此很明显,至少需要了解计算机视觉、对象识别、知识库、短期/长期规划、音频识别、自然语言处理、视觉注意模型, ETC。显然,仅仅独立研究每个领域是不够的,还需要想办法将所有内容集成到一个系统中。

那么,有没有人知道与这个问题相关的内容的好资源?我将不胜感激任何对论文、书籍、博客以及任何有用的资源(理想情况下是最先进的)的建议,这将对对这个问题感兴趣的人有所帮助。

提前致谢。

2个回答

你提出了一个有趣的问题。我看到的问题是,即使您开发了您提到的所有项目(我不确定您是否需要所有这些项目),您也不具备为此所需的计算能力。

你看,这些项目中的大多数都是基于强化学习的。这意味着模型被赋予一组相对较小的数据(粗略地说,游戏规则),然后开始玩数百万和数百万的游戏。阅读由 Google 编写的关于击败 Go 的白皮书。他们基本上承认,重点是写一些非常非常简单的东西,可以自己学习,然后在谷歌的巨大力量上释放它。他们没什么好说的,“让这个机器人玩一千万场比赛吧”。所以你的初始模型的复杂程度很低,你只需要让它成为一个优秀的学习者。

所以你成为了星际争霸的杰出学习者——然后呢?你将如何拥有让你的算法玩数百万个游戏的能力?

此答案基于我和其他人的意见,可能不是您期望的答案。

您要解决的问题可能是在通用人工智能领域。需要 AGI 解决的问题被非正式地称为AI-complete

假设 AI 完整问题包括计算机视觉、自然语言理解以及在解决任何现实世界问题时处理意外情况。

目前,我们还没有准备好解决这些问题,如果 Gartner 是正确的,那么炒作不会在 10 年内达到顶峰。

这是 Gartner 2017 年的炒作曲线,AGI 仍处于早期阶段。

这是 Gartner 2017 年的炒作曲线,AGI 仍处于早期阶段

问题是,目前,我们最先进的人工智能模型(深度学习)无法解释他们的决定或行为原因,这使得学习效率非常低。

此外,强化学习框架过于简单,忽略了人类环境的复杂性。您可能会发现此答案很有用。

该领域的领军人物之一 Geoffrey Hinton 在接受采访时表示,人工智能需要重新开始

“我的观点是扔掉一切,重新开始,”

“我不认为这是大脑的工作方式。我们显然不需要所有标记的数据。”

就是这样。如果有一天 AI 可以学习如何玩星际争霸 2,那么它的学习方式可能与今天的学习方式截然不同。