人工智能 - 我们可以在没有生成模型的情况下使用 MCTS 吗？ - 吾爱随笔录

人工智能强化学习蒙特卡罗树搜索

2021-11-04 09:04:14

1个回答

您要么需要生成模型，要么需要环境模拟器。在后一种情况下，您不使用模型计算转换和奖励，而是将您的操作和状态提供给模拟器并使用结果。

模拟器可以是一个黑盒子，只要它在提供当前状态和动作时返回下一个状态和奖励。您还需要一种方法来识别给定状态下的所有法律行为以构建树。

其它你可能感兴趣的问题