人工智能 - AlphaGo 的神经网络的输入是什么？ - 吾爱随笔录

AlphaGo 的神经网络的输入是什么？

人工智能神经网络深度学习强化学习建筑学阿尔法零

2021-10-31 20:24:25

我一直在阅读一篇关于 AlphaGo 的文章，其中一句话让我有点困惑，因为我不确定它的确切含义。文章说：

AlphaGo Zero 仅使用围棋板上的黑白棋子作为输入，而之前版本的 AlphaGo 包含少量手工设计的功能。

AlphaGo 神经网络的输入到底是什么？他们所说的“只有白色和黑色的石头作为输入”是什么意思？神经网络使用什么样的信息？石头的位置？

1个回答

神经网络的输入是 $19 × 19 × 17$ 图像堆栈包括 $17$ 二元特征平面。 $8$ 特征平面 $X_t$ 由指示当前玩家棋子存在的二进制值组成（ $X^i_t = 1$ 如果相交 $i$ 在时间步长包含玩家颜色的石头 $t$ ; $0$ 如果交叉路口是空的，包含对手的棋子，或者如果 $t < 0$ ）。进一步 $8$ 特征平面， $Y_t$ ，代表对方棋子的对应特征。最后的特征平面， $C$ , 代表要播放的颜色，并且有一个常数值 $1$ 如果要玩黑棋或 $0$ 如果是白玩。这些平面连接在一起以提供输入特征 $s_t = [ X_t, Y_t, X_{t−1}, Y_{t−1}, ..., X_{t−7}, Y_{t−7}, C]$ .

这个和所有其他架构细节可以在论文的“神经网络架构”部分找到。

其它你可能感兴趣的问题

上一篇Alphazero 保单人头损失没有减少下一篇Q-Learning 中新状态的最大 Q 值从不存在