使用机器学习的拼字游戏

人工智能 机器学习 强化学习 遗传算法
2021-10-24 20:40:30

我一直在思考是否可以使用机器学习来玩拼字游戏。我在 ML 领域的知识有限,因此我正在寻求一些指点 :)

我想知道如何构建一个模型,从当前游戏状态的所有给定有效动作中选择一个动作,然后执行该动作并等待延迟的奖励。这里的动作不是静态动作,它们基本上是选择移动以最大化最终得分。

有没有办法对有效动作进行编码,然后使用模型来选择这些动作?

我也考虑过遗传方法,但我认为如果我可以用一组特征(分数、辅音元音比率、机架离开分数、移动后的#blank tile 等)来表示我的移动,训练神经网络像这样可能需要很长时间。

另一个与训练相关的问题,考虑到我将在每次动作后等待对手(例如 Quackle)的响应(新的游戏状态),在 GPU 上运行训练是否可行?

谢谢 :)

1个回答

拼字游戏是使用强化学习解决的,实现了超人的表现。如果您有兴趣,可以从这里开始阅读:https ://en.wikipedia.org/wiki/Maven_(Scrabble)#cite_note-1

您也可以在这里阅读:http ://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching_files/games.pdf (有几张关于 Maven 的幻灯片)