我一直在阅读一篇关于 AlphaGo 的文章,其中一句话让我有点困惑,因为我不确定它的确切含义。文章说:
AlphaGo Zero 仅使用围棋板上的黑白棋子作为输入,而之前版本的 AlphaGo 包含少量手工设计的功能。
AlphaGo 神经网络的输入到底是什么?他们所说的“只有白色和黑色的石头作为输入”是什么意思?神经网络使用什么样的信息?石头的位置?
我一直在阅读一篇关于 AlphaGo 的文章,其中一句话让我有点困惑,因为我不确定它的确切含义。文章说:
AlphaGo Zero 仅使用围棋板上的黑白棋子作为输入,而之前版本的 AlphaGo 包含少量手工设计的功能。
AlphaGo 神经网络的输入到底是什么?他们所说的“只有白色和黑色的石头作为输入”是什么意思?神经网络使用什么样的信息?石头的位置?
神经网络的输入是图像堆栈包括二元特征平面。特征平面由指示当前玩家棋子存在的二进制值组成(如果相交在时间步长包含玩家颜色的石头;如果交叉路口是空的,包含对手的棋子,或者如果)。进一步特征平面, ,代表对方棋子的对应特征。最后的特征平面,, 代表要播放的颜色,并且有一个常数值如果要玩黑棋或如果是白玩。这些平面连接在一起以提供输入特征 .
这个和所有其他架构细节可以在论文的“神经网络架构”部分找到。