我正在尝试使用强化学习为纸牌游戏创建 AI。游戏的基本原理是,您(理论上)可以拥有多达 35 张牌,您也可以拥有多达 35 张“在场”的牌,您的对手也可以。在正常游戏中,您手上大约有 6 张牌,每张可能有 3 张。总共大约有 300 张独特的卡片。
我应该如何表示输入的游戏状态以及我应该如何表示输出中要采取的动作?
我正在尝试使用强化学习为纸牌游戏创建 AI。游戏的基本原理是,您(理论上)可以拥有多达 35 张牌,您也可以拥有多达 35 张“在场”的牌,您的对手也可以。在正常游戏中,您手上大约有 6 张牌,每张可能有 3 张。总共大约有 300 张独特的卡片。
我应该如何表示输入的游戏状态以及我应该如何表示输出中要采取的动作?
假设手牌没有顺序(即添加什么顺序牌并不重要),那么一个合理的方法是使用一个输入神经元来计算玩家手中每种牌的数量。
您没有描述游戏是如何进行的,但提取动作的一种常用方法是为每个可能的动作设置一个输出神经元。要选择一个动作,您将选择对应于对给定输入具有最高输出响应的神经元的动作。