minimax 的概率版本将如何工作?
例如,我们可能会选择一个可能导致非常糟糕结果的举动,但这种结果可能极不可能,因此我们可能认为值得冒险。
minimax 的概率版本将如何工作?
例如,我们可能会选择一个可能导致非常糟糕结果的举动,但这种结果可能极不可能,因此我们可能认为值得冒险。
是的,minimax 至少有一个概率版本,称为expectiminimax。在expectiminimax中,除了min和max节点外,还有机会节点,它们对后继节点进行加权求和,因此必须知道与机会节点相关的概率。鉴于expectiminimax假设存在随机事件(由机会节点表示),因此决策基于预期值。
《 Artificial Intelligence: A Modern Approach》一书的第 5.5 节描述了由Donald Michie在Game-playing and game-learning automata (1966)中介绍的 expectiminimax 算法。论文Optimal strategy in games with chance nodes (2007) 也对 expectiminimax 算法给出了不错的描述。