你如何在神经网络中编码棋步?

人工智能 神经网络
2021-10-27 11:28:34

在国际象棋(或跳棋)的神经网络中,输出是棋盘上的一块或正方形和一个结束位置。

将如何编码?

据我所见,选择一个起始方块是 8x8=64 个输出,一个结束方块是 8x8=64 个输出。所以可能的移动总数是 64x64 4096 个输出。给出每一个可能的移动的概率。

这个对吗?这似乎是一个非常多的输出!

1个回答

来自谷歌的号码是4672

https://arxiv.org/pdf/1712.01815.pdf

A move in chess may be described in two parts: selecting the piece to move, and then
selecting among the legal moves for that piece. We represent the policy π(a|s) by a 8 × 8 × 73
stack of planes encoding a probability distribution over 4,672 possible moves. Each of the 8×8
positions identifies the square from which to “pick up” a piece.

4672 听起来可能是一个很大的数字,但它与谷歌(和许多其他竞争对手)在深度学习图像分析方面所做的事情无关。