伯克利大学关于近零和博弈的 AI 课程问题

人工智能 研究
2021-11-10 11:39:51

我从伯克利的人工智能课程中得出这个问题(也不确定它是否是正确的提问地点,所以我提前道歉) https://inst.eecs.berkeley.edu/~cs188/pacman/course_schedule.html

目前,我正在处理第 3 部分的作业。

我的问题是:问题(第 1 部分,问题 6)。为什么我们只能保证如果 Min 代理的行为次优,我们可以期望的最好的就是以下在此处输入图像描述

似乎我们可以为第二个节点设置任意值,例如它必须是-Episolon。它可以是任意范围的值,例如 Epsilon,在这种情况下我们会优化 Player A

1个回答

(使用 X 表示 epsilon,因为键盘)

这只是一个假设,但如果你有一个最大化代理和一个最小化代理,那么 A(最大化)的最佳结果是扫过棋盘(X,0),而 B(最小化)的最佳结果是(- X,0) 因为 B 正在最小化 A 的分数,而不是他们自己的分数。

然后,A 的最优结果会因次优因素而变得复杂,然后我们想象它接近于零。

但是,如果这个假设是真的,似乎有很多假设没有被阐明。