AlphaGo 的神经网络的输入是什么?

人工智能 神经网络 深度学习 强化学习 建筑学 阿尔法零
2021-10-31 20:24:25

我一直在阅读一篇关于 AlphaGo 的文章,其中一句话让我有点困惑,因为我不确定它的确切含义。文章说:

AlphaGo Zero 仅使用围棋板上的黑白棋子作为输入,而之前版本的 AlphaGo 包含少量手工设计的功能。

AlphaGo 神经网络的输入到底是什么?他们所说的“只有白色和黑色的石头作为输入”是什么意思?神经网络使用什么样的信息?石头的位置?

1个回答

神经网络的输入是19×19×17图像堆栈包括17二元特征平面。8特征平面Xt由指示当前玩家棋子存在的二进制值组成(Xti=1如果相交i在时间步长包含玩家颜色的石头t;0如果交叉路口是空的,包含对手的棋子,或者如果t<0)。进一步8特征平面,Yt ,代表对方棋子的对应特征。最后的特征平面,C, 代表要播放的颜色,并且有一个常数值1如果要玩黑棋或0如果是白玩。这些平面连接在一起以提供输入特征 st=[Xt,Yt,Xt1,Yt1,...,Xt7,Yt7,C].

这个和所有其他架构细节可以在论文的“神经网络架构”部分找到。