我一直在思考是否可以使用机器学习来玩拼字游戏。我在 ML 领域的知识有限,因此我正在寻求一些指点 :)
我想知道如何构建一个模型,从当前游戏状态的所有给定有效动作中选择一个动作,然后执行该动作并等待延迟的奖励。这里的动作不是静态动作,它们基本上是选择移动以最大化最终得分。
有没有办法对有效动作进行编码,然后使用模型来选择这些动作?
我也考虑过遗传方法,但我认为如果我可以用一组特征(分数、辅音元音比率、机架离开分数、移动后的#blank tile 等)来表示我的移动,训练神经网络像这样可能需要很长时间。
另一个与训练相关的问题,考虑到我将在每次动作后等待对手(例如 Quackle)的响应(新的游戏状态),在 GPU 上运行训练是否可行?
谢谢 :)