我需要在有限的时间内为2048 游戏编写一个带有 alpha-beta 修剪的 minimax 算法。我知道 expectimax 更适合这项工作。
假设我写了不同的启发式函数。如果我想将评估函数编写为这些启发式函数的线性组合,我是否必须给出随机权重,或者我可以使用一些优化算法计算最佳权重?
我需要在有限的时间内为2048 游戏编写一个带有 alpha-beta 修剪的 minimax 算法。我知道 expectimax 更适合这项工作。
假设我写了不同的启发式函数。如果我想将评估函数编写为这些启发式函数的线性组合,我是否必须给出随机权重,或者我可以使用一些优化算法计算最佳权重?