人工智能 - 在个人电脑上训练 AlphaZero 或 MuZero（独立游戏）是否可行？ - 吾爱随笔录

在个人电脑上训练 AlphaZero 或 MuZero（独立游戏）是否可行？

人工智能训练游戏-ai 零字母穆泽罗

2021-11-11 10:50:00

使用家用游戏 PC 训练 AlphaZero/MuZero 引擎是否实用/负担得起，还是需要数千年的训练才能让 AI 学习到足以挑战人类的能力？

我很难理解“4 小时的 Google DeepMind 训练”相当于我的住宅计算机 24/7 运行试图构建一个训练有素的 AI 的计算能力。

基本上，AlphaZero 或 MuZero 是否适用于需要最先进 AI 的独立棋盘游戏，还是训练成本太高？

1个回答

现在，绝大多数神经网络都在图形处理单元 (GPU) 或张量处理单元(TPU) 等专用加速器硬件上进行训练。

在使用通用强化学习算法通过自我对弈掌握国际象棋和将棋中，Silver 等人。说训练过程涉及 5000 个第一代 TPU 生成自我对战游戏和 64 个第二代 TPU 进行训练。这肯定远远超出了任何实际游戏计算机可能实现的目标，因为您可能只有一个 GPU，甚至可能无法与单个 TPU 相媲美。CPU 上的训练将再次比 GPU 或 TPU 慢得多。训练会慢几个数量级；您可能会发现Wang 等人的这些基准。出于兴趣。

其它你可能感兴趣的问题

上一篇未来会不会有一些有前途的技术可以让人工智能变得更环保、更实惠？下一篇具有连续动作的策略梯度的损失是多少？