使用家用游戏 PC 训练 AlphaZero/MuZero 引擎是否实用/负担得起,还是需要数千年的训练才能让 AI 学习到足以挑战人类的能力?
我很难理解“4 小时的 Google DeepMind 训练”相当于我的住宅计算机 24/7 运行试图构建一个训练有素的 AI 的计算能力。
基本上,AlphaZero 或 MuZero 是否适用于需要最先进 AI 的独立棋盘游戏,还是训练成本太高?
使用家用游戏 PC 训练 AlphaZero/MuZero 引擎是否实用/负担得起,还是需要数千年的训练才能让 AI 学习到足以挑战人类的能力?
我很难理解“4 小时的 Google DeepMind 训练”相当于我的住宅计算机 24/7 运行试图构建一个训练有素的 AI 的计算能力。
基本上,AlphaZero 或 MuZero 是否适用于需要最先进 AI 的独立棋盘游戏,还是训练成本太高?
现在,绝大多数神经网络都在图形处理单元 (GPU) 或张量处理单元(TPU) 等专用加速器硬件上进行训练。
在使用通用强化学习算法通过自我对弈掌握国际象棋和将棋中,Silver 等人。说训练过程涉及 5000 个第一代 TPU 生成自我对战游戏和 64 个第二代 TPU 进行训练。这肯定远远超出了任何实际游戏计算机可能实现的目标,因为您可能只有一个 GPU,甚至可能无法与单个 TPU 相媲美。CPU 上的训练将再次比 GPU 或 TPU 慢得多。训练会慢几个数量级;您可能会发现Wang 等人的这些基准。出于兴趣。