我想从一个让我思考 MCTS 性能如何的场景开始:假设有一个移动尚未添加到搜索树中。这是一些层/移动太深。但是如果我们玩这个动作,游戏基本上就赢了。但是,我们还假设在给定的游戏状态下可以采取的所有动作都非常非常糟糕。为了争论起见,假设有 1000 种可能的移动,其中只有一种是好的(但非常好),其余的非常糟糕。MCTS 不会没有认识到这一点,而不是朝着这个方向发展搜索树并且对这个子树的评价也很差?我知道 MCTS 最终会收敛到 minimax(如果有足够的内存,它最终会构建整个树)。然后它应该知道这一步是好的,即使有很多不好的可能性。但我想在实践中这不是一个可以依赖的东西。也许有人可以告诉我这是否是我的正确评价。
除了这种特殊情况外,我还想知道是否还有其他此类情况 MCTS 会表现不佳(或非常好)。