为什么多人游戏、信息不完善、卡牌游戏对 AI 来说很难?

人工智能 赌博 最先进的 计算复杂度 不完全信息 机会游戏
2021-11-08 14:24:05

AI 在国际象棋围棋德州扑克Dota2StarCarft2等许多复杂游戏中达到了超人的水平但是在花样卡牌游戏中它仍然没有达到这个水平。

为什么没有超人类AI 可以玩黑桃、惠斯特、红心、尤克和桥牌等信息不完全、多人、花招的纸牌游戏?

特别是在那些游戏中制作超人 AI的障碍是什么?


我认为这些是让 AI 难以掌握 Spades 的原因:

  1. 不完全信息博弈带来了两个明显的问题:移动选择和推理。

  2. 游戏树的规模并不小,但已经掌握了更大的游戏。

    一、历史规模14!4=5.71043

    二、52!13!4=5.41028可能的初始状态。

    三、每个初始信息集都可以在39!13!3=8.451016方法

  3. 仅在终端状态进行评估

  4. 多人游戏:

    I. 更难修剪 - 搜索算法效率较低

    二、对手造型很难

    三、目标选择 - 有几个目标可用,需要在回合中根据狂欢信息改变目标。

  5. 代理需要与合作伙伴协调:约定信号

1个回答

由于没有人回答我的问题,我会尝试自己回答,但是虽然我确实编写了 AI 代理,但我不是专家。

Trick-taking 游戏太大,无法用当前的搜索算法和计算能力来解决[RSBS19]原因如下:

  1. 反事实遗憾最小化(CFR)是解决大型不完美信息博弈的主要框架。[BLGS19]

  2. CFR 需要为所有参与者构建策略并迭代所有信息集。[ZJBP07]

  3. CFR 在扑克中达到了超人的水平,但在黑桃和其他花样游戏中表现不佳,因为:

    (a) 大量信息集。我对黑桃的估计是10^58

    (b) 没有好的抽象(还没有找到)。作为比较,在扑克抽象中显着减小了游戏树的大小。[LSBF10]


  • 在改进了我的 Spades-agent之后,它赢得了超过 60% 的她的游戏与休闲玩家。不幸的是,我从未测试过她的 Vs 专家。

  • 如果 DeepMind 或有能力的人尝试制作一个超人的欺骗代理,我猜他们会成功。