人工智能 - 使用机器学习的拼字游戏 - 吾爱随笔录

我一直在思考是否可以使用机器学习来玩拼字游戏。我在 ML 领域的知识有限，因此我正在寻求一些指点 :)

我想知道如何构建一个模型，从当前游戏状态的所有给定有效动作中选择一个动作，然后执行该动作并等待延迟的奖励。这里的动作不是静态动作，它们基本上是选择移动以最大化最终得分。

有没有办法对有效动作进行编码，然后使用模型来选择这些动作？

我也考虑过遗传方法，但我认为如果我可以用一组特征（分数、辅音元音比率、机架离开分数、移动后的#blank tile 等）来表示我的移动，训练神经网络像这样可能需要很长时间。

另一个与训练相关的问题，考虑到我将在每次动作后等待对手（例如 Quackle）的响应（新的游戏状态），在 GPU 上运行训练是否可行？

谢谢：）