最近引起我注意的是,国际象棋专家认为这场现在著名的比赛的结果令人不安。
作为国际象棋和国际象棋 AI 的非专家,我的假设是,基于 AlphaGo 的表现,以及与组合游戏相关的这种方法的验证,旧的 AI 将没有机会。
- 为什么 AlphaZero 的胜利令人惊讶?
最近引起我注意的是,国际象棋专家认为这场现在著名的比赛的结果令人不安。
作为国际象棋和国际象棋 AI 的非专家,我的假设是,基于 AlphaGo 的表现,以及与组合游戏相关的这种方法的验证,旧的 AI 将没有机会。
好问题。
首先也是最重要的一点是,在 Go deepmind 中没有超人的对手可以挑战。围棋引擎远不及顶级人类棋手的最高水平。然而,在国际象棋中,引擎比顶级人类棋手强 500 ELO 点。这是一个巨大的差异。进入当代国际象棋引擎的工作量是惊人的。我们谈论的是数百万小时的编程,数十万次迭代。这是大量的知识和工作。在 4 小时内克服和超越所有这些是惊人的。
其次,让国际象棋大师感到惊讶的不是结果本身,而是AlphaZero下国际象棋的方式。具有讽刺意味的是,一个没有人类知识或专业知识的系统最像我们这样玩。引擎因下棋丑陋、缺乏和谐等而臭名昭著。对于非国际象棋玩家来说,这很难解释,但是像当代引擎一样经常出现“人造动作”之类的东西。AlphaZero 根本不是这样玩的。它具有非常人性化的风格,以深刻的战略游戏和惊人的位置牺牲来统治对手的棋子。AlphaZero 以我们渴望的方式发挥作用,将深入的位置理解与引擎计算的精度相结合。
编辑 哦,我忘了提及结果本身。如果您不熟悉计算机国际象棋,它可能看起来并不令人震惊,但确实如此。
如今,将当代顶级发动机分开的胜利边缘非常微薄。在 100 场比赛中,您可能会看到 85 场平局、9 胜 6 负的结果来确定更好的引擎。
AlphaZero 28 胜 72 平 0 负的战绩是超凡脱俗的,在它发生的那一刻是完全不可想象的。
用于国际象棋的 MCTS 已在文献中进行了尝试,但收效甚微。人们假设 AlphaGo 的方法永远不会在国际象棋上奏效,也许在围棋中但在国际象棋中无效。突然,谷歌宣布这种方法正在奏效,它以非常显着的优势击败了世界上最强的国际象棋程序。
在谷歌之前,所有国际象棋程序员都被教导在引擎编程中制作启发式算法是比机器学习更好的策略。无论您如何实现神经网络,它都不会比一堆 64 位位板指令运行得更快。AlphaGo 跑得很慢,但它下的棋力最强。
我看到,根据您提供的文章,胜利中的许多惊喜:
国际象棋很难掌握,对手有世界上最好的做法,AlphaZero 有白纸。
学习花了四个小时,AlphaZero 没有输掉 100 场比赛。
游戏风格是人类和计算机的异类混合,例如动作,具有侵略性,有时看起来很愚蠢,牺牲了不知道但实际上使未来地位更加强大的牺牲。
每次移动考虑的可能性数量少于对应部分,AlphaZero 有一种神秘的直觉或直觉。
令人沮丧的感觉来自 AlphaZero 自己构建的大量培训材料和时间限制,这可能没有给传统机器足够的时间。