为什么要花这么多时间和金钱来构建 AI 来玩游戏?

人工智能 研究 博弈论 图灵测试 领域
2021-10-18 21:29:00

我正在阅读有关约翰麦卡锡和他对人工智能的正统愿景的文章。在我看来,他似乎不太赞成将资源(如时间和金钱)用于让 AI 玩国际象棋等游戏。相反,他希望更多地专注于通过图灵测试和人工智能模仿人类行为。

我也读过很多关于大公司的文章,比如 IBM、Google 等,花费数百万美元让 AI 玩游戏,比如国际象棋、围棋等。

这在多大程度上是合理的?

3个回答

在《人工智能:一种现代方法》(第 5.7 节,第 185 页)一书中,Russell 和 Norvig 写道

1965年,俄罗斯数学家亚历山大·克朗罗德称国际象棋为“人工智能的果蝇”。约翰麦卡锡不同意:虽然遗传学家使用果蝇来做出更广泛地应用于生物学的发现,但人工智能已经使用国际象棋来做相当于培育非常快的果蝇。或许一个更好的类比是,国际象棋之于人工智能,就像大奖赛赛车之于汽车行业:最先进的游戏程序是令人眼花缭乱的快速、高度优化的机器,它融合了最新的工程进步,但它们并不多用于购物或越野驾驶。尽管如此,赛车和游戏会产生兴奋和源源不断的创新,这些创新已被更广泛的社区所采用

因此,尽管这些游戏(如国际象棋、围棋和桥牌)显然对许多人没有用/有益,但为玩它们而开发的 AI 程序已经引入/包含了概念/技术,例如空步启发式、无效修剪组合游戏理论精巧挤压元推理,这可能对更广泛的计算机科学(而不仅仅是人工智能)有用。

你可以看到它类似于 NASA、ISRO、JAXA 和其他太空机构的太空任务。所有这些任务似乎对公民没有直接的好处,但有很多间接的好处。它们为技术创新(GPS、3D 打印、车祸技术、清洁能源、LED)、创造就业机会等铺平了道路。推进风暴、飓风探测是太空探索的成果,它已经挽救了全球数百万人的生命。

游戏中的人工智能不仅有助于开发软件,还有助于开发硬件。许多创新已被视为生产高度优化和强大的硬件。

为什么游戏研发成为资源配置的焦点?

当研究人员试图模拟部分人类解决问题的能力时,当研究对游戏的明显痴迷时,John McCarthy (1927 – 2011) 的观点的正统观点可能会产生误导。

出版编辑偏见和流行的科幻小说主题可能会掩盖导致对开发获胜棋盘游戏软件的痴迷的主要力量。在审查情报研究和开发的许多领域内的资金和人力资源分配时,需要一些历史背景来避免这个社会网络中问题答案的典型扭曲。

历史背景

在分析历史(包括科学和技术史)时,将自己置身于其他时期的思维模式中的能力是有帮助的。

考虑到麦卡锡的愿景在他那个时代并不是正统的。由于紧随西方工业化之后的一段时间,科学家和数学家对自动化的思考出现了一系列新兴趋势,它很快就成为了正统。这种思想是印刷、纺织、农业、运输业和战争机械化的自然延伸。

到了 20 世纪中叶,其中一些趋势结合起来形成了数字计算机的概念。其他人则成为通过数字系统调查情报方面的人们社区中的正统派。技术背景包括理论工作和机电工作,其中一些已经获得了一定程度的公众知名度。但在当时,它通常要么是秘密的,要么过于抽象(因此晦涩难懂)而不能被视为涉及国家安全利益的项目。

  • 控制论理论,主要由 Norbert Wiener (1894 – 1964) 开发
  • 在自动化算术方面所做的工作(扩展 George Boole 的理论和 Blaise Pascal 的计算器,主要资金来自美国军方,旨在通过计算飞机敌人的可能轨迹并确定球坐标来引导防空武器,以创建一个可能有趣的弹道轨迹
  • 经常忽视 Alonso Church (1903 – 1995) 在 lambda 演算方面的工作,这导致了函数式编程的想法,这是剑桥 LISP 出现的一个关键方面,McCarthy 将其用于早期的人工智能实验
  • 信息论的诞生,主要是通过 Claude Shannon (1916 – 2001) 的工作,贝尔实验室资助了自动化通信交换
  • Church 博士生 Alan Turing 的早期密码分析工作完全由盟军资助,其研发目标是击败 Enigma 密码设备,以便在彻底歼灭伦敦和其他盟军目标之前阻止纳粹军队
  • John von Neumann (1903 – 1957) 的工作是将任意布尔逻辑的实现与整数运算集中到一个单元(目前称为 CPU)中,并将控制电子触发器实现的程序与数据一起存储要处理的结果和结果(当今几乎所有当代计算设备都采用相同的通用架构)

所有这些都是围绕自动机视觉的概念,即哺乳动物神经学功能方面的模拟。(猴子或大象可以成功地计划和执行对苍蝇的拍打,但苍蝇无法计划和执行对猴子或大象的攻击。)

使用新的编程语言 LISP 通过符号操作进行智能实验及其模拟是 John McCarthy 的主要关注点,也是他在创建 MIT AI 实验室中所扮演的角色。但是,无论基于规则的(生产系统)、神经网络和遗传算法可能存在什么正统观念,都在很大程度上多样化成一堆想法,这使得正统观念这个词有些模糊。下面举几个例子。

  • 理查德斯托曼从麻省理工学院人工智能实验室辞职,并开始从当时主导的许多经济哲学进行哲学转变。结果是 GNU 软件和 LINUX,其次是开放硬件和知识共享,这些概念在很大程度上反对那些资助 AI 温床的哲学取向。
  • 许多专有(因此是公司机密)系统使用的贝叶斯方法或自适应组件更多地来自 Norbert Wiener 的工作,而不是 1970 年代被认为是主流 AI 研究的任何东西。

博弈论的诞生

在这一系列历史事件中,最直接回答这个问题的关键事件是冯·诺依曼的其他一些作品。他与 Oskar Morgenstern 合着的著作《博弈论》可能是导致围棋和国际象棋作为问题解决软件测试场景持续存在的历史条件中最强大的因素。

尽管早期有许多关于如何在国际象棋或围棋中获胜的著作,但从未有过像博弈论那样引人注目的数学处理和演示。

科学界的特权成员非常清楚冯·诺依曼成功地将裂变材料的温度和压力提高到临界质量,以及他从量子理论推导出经典热力学的工作。他在博弈论中提出的数学基础很快被(一些资助麻省理工学院研究的人)接受为一种潜在的经济学预测工具。预测经济学是控制它的第一步。

理论遇上地缘政治哲学

在那个时期推动西方政策的主导哲学是昭昭天命,本质上是新世界秩序的宿命论观点,其领导人将是美国的权力。解密文件表明,当时的领导人很可能认为通过应用博弈论实现经济统治的风险和成本远低于军事征服,然后在海外每个人口稠密地区附近维护行动基地(高科技驻军) .

开发国际象棋和围棋自动机的广为人知的挑战只是公司和政府在获取人员资产时使用的拉网。比赛结果就像简历。一个获胜的游戏程序是编程技能存在的一个证据,该技能也可能在开发更重要的游戏中获得成功,这些游戏可以带来数十亿美元或赢得战争。

那些能够编写赢得国际象棋或围棋代码的人被视为高价值资产。资助游戏研究被视为识别这些资产的一种方式。即使在没有立即获得投资回报的情况下,这些资产的识别,因为它们可以藏在智库中以谋划统治世界,也成为分配研究资金时的首要考虑因素。

缓慢和快速的投资回报路径

与这种地缘政治思维相反,在某些狡猾的程序员或团队背后寻求机构声望是另一个因素。在这种情况下,寻求在某些重要的工业或军事应用中具有几何改进潜力的模拟智能的任何进展。

例如,像 Maxima(Mathematica 等数学问题解决应用程序的先驱)这样的程序得到了资助,希望使用符号计算来发展数学。

这条通往成功的道路在概念上建立在作为一种总体自然哲学的决定论之上。事实上,它是决定论的缩影。有人提出,如果计算机不仅可以进行算术运算,而且可以开发出超人类复杂性的数学定理,那么人类努力的模型就可以简化为方程并求解。然后可以将各种重要经济、军事和政治现象的可预测性用于决策,从而获得显着收益。

令许多人惊讶的是,Maxima 和其他数学计划的成功在其对可靠预测经济和地缘政治事件的能力的积极影响方面非常有限。混沌理论的出现解释了原因。

事实证明,用程序击败人类大师是 20 世纪研发的能力范围之内。使用软件来试验各种计算机科学方法来赢得比赛是可以实现的,因此对于机构来说作为一种获得声望的方式更具吸引力,就像一支获胜的篮球队一样。

让我们不要忘记发现

有时表象与现实直接相反。上面提到的思维机器的各种应用并没有被遗忘,模拟哺乳动物能力方面所需的时间和金钱成本不会失去对棋盘游戏自动机开发的资金。

技术主要用于解决通信、军事、地缘政治、经济和金融问题,这些问题远远超过国际象棋和围棋等游戏的复杂性。博弈论包括早在其一开始就由非玩家随机移动的元素。因此,对国际象棋的痴迷只是模拟智能的许多领域的资金和活动的实际焦点的一个标志。

可以玩国际象棋或围棋的软件既没有部署到 NSA 全球建模计算机,也没有部署到谷歌的索引机器上。大笔资金用于开发部署到这些地方的 IS。

您将永远不会看到在线描述的该研发的详细信息甚至概述,除非有人出于个人令人信服的原因违反其公司保密协议或犯下叛国罪。

我觉得这个说法令人不安,因为第一个被证实的算法智能可能是NIM 自动机,所以在我看来,算法智能的发展与组合游戏密不可分。麦卡锡似乎也不认为游戏是有用的,这让我怀疑他从未认真研究过游戏的历史。

组合博弈论是数学和计算领域的一个应用领域,是在对 NIM 博弈进行数学分析的Sprague-Grundy 定理之后的几十年中形成的。最近,蛋白质折叠游戏Foldit在应用领域产生了真正的成果。

  • 我通常给出的答案是,国际象棋和围棋等游戏使用极其简单的参数提供了类似于自然的复杂性。(本质上,组合游戏和谜题,如数独,是复杂性引擎。)

但是,与单人努力的谜题不同,游戏需要一种非常有用的战略决策。(@Ugnes 答案列出了其中的许多。)

  • 尤其是组合博弈为算法管理棘手问题的能力提供了一个有用的基准。

还有一个公关因素。近年来,算法语言翻译变得非常好,但你从来没有听到媒体对此大肆宣传。与 DeepBlue 与 Kasparov 或 AlphaGo 与 Sedol 进行比较。(在 AlphaGo 的结果之后,这个堆栈中出现了 ML 问题。)这类似于美国登月,这是一项伟大的工程壮举,如果不是绝对必要的话,它激发了几代初露头角的科学家。


后记:值得注意的是,直到最近,“强”这个词还是为通用人工智能保留的,这仍然是高度理论化的。在 AlphaGo 之后,我开始看到学者们使用“Strong Narrow AI”这个词。

与通用人工智能相关的强的使用纯粹是哲学上的。相比之下,该术语在组合博弈论中的使用方式(参见Solved Game)纯粹是实用的,并且涉及数学证明。

国际象棋仍未解决,因此它仍然对学习有用。[见下面的长颈鹿国际象棋。]

博弈论和组合博弈论的领域包括冯·诺依曼纳什康威等名字,最近还有麻省理工学院的德曼。如果你想包括像数独这样的组合谜题,我们可以把它延伸到欧拉由于这些原因以及上面列出的原因,我很难将游戏分析视为微不足道的追求。


Giraffe Ches s 是一位数学家/程序员 Matthew Lai 最近的成果,他使用神经网络方法创建了一种国际象棋算法,该算法可以在 72 小时内自学以达到国际大师级别。

Lai 的目标之一是创建一种能够产生更多“人类游戏”的算法。(与 AlphaGo 等算法的“不人道”游戏相比。)长颈鹿不是 AGI,但它当然可以被视为拼图的一部分。

电脑游戏可以说是人类和自动机共享的最深层次的交互类型,而这种类型的交互几乎可以追溯到现代计算的诞生。