最近击败扑克职业玩家的机器(DeepStack)有多强大?
最近击败扑克职业玩家的机器有多厉害?
人工智能
参考请求
硬件
不完全信息
扑克
深栈
2021-11-13 00:47:26
1个回答
这似乎是为了训练:
对于转牌网络,使用 Calcul Quebec MP2 研究集群的 6,144 个 CPU 核心,使用超过 175 个核心年的计算时间,生成和解决了一千万次扑克转牌情况(从转牌后开始)。对于翻牌网络,产生并解决了 100 万个扑克翻牌情况(从发牌后)。这些情况是使用 DeepStack 的深度有限求解器解决的,该求解器在转牌后立即使用转牌网络用于公共状态的反事实值。我们使用了 20 个 GPU 的集群和 GPU 一年的一半计算时间。对于辅助网络,生成了 1000 万种情况,并通过枚举所有 22,100 个可能的翻牌并对翻牌网络输出的反事实值进行平均来获得目标值。
这是实际游戏:
重新求解计算和神经网络评估均在 Torch7 (53) 中实现,并在单个 NVIDIA GeForce GTX 1080 显卡上运行。
比较一下:AlphaGo 的分布式版本需要 1.920 个 CPU 和 280 个 GPU 才能运行。