我在下面执行了蒙特卡洛树搜索 (MCTS)。我需要扩展它,但我不明白第 1 步和第 2 步。
为什么它会先到第一个节点然后再做一个新节点,而不是去最深的左叶?我认为它需要去最可能的叶子。
在 MCTS 的第 1 步中,它添加了一个新节点。现在,有9个案例。
在 MCTS 的第 2 步中,它添加了一个新节点。现在,第一个节点下有2个案例: