我的 AI(用于纸牌游戏 schnapsen)目前计算游戏可能结束的所有可能方式,然后评估每张可玩纸牌/移动的获胜百分比。计算是使用树递归完成的。如果游戏可以以三种不同的方式继续进行,则在该节点上获胜的百分比将是
在哪里介于 0 和 2 之间,是平均值并且标准差。当游戏无法进行时,AI 获胜百分比为 100,失败时为 0。我将标准差包括在此公式中,以防止 AI 冒太大风险。换句话说:我使用的是使用百分比的 MCTS。
有没有更好的公式或方法来计算下一步行动,以最大限度地提高获胜的机会?包括标准偏差有意义吗?