人工智能 - 伯克利大学关于近零和博弈的 AI 课程问题 - 吾爱随笔录

人工智能研究

2021-11-10 11:39:51

我从伯克利的人工智能课程中得出这个问题（也不确定它是否是正确的提问地点，所以我提前道歉） https://inst.eecs.berkeley.edu/~cs188/pacman/course_schedule.html

目前，我正在处理第 3 部分的作业。

我的问题是：问题（第 1 部分，问题 6）。为什么我们只能保证如果 Min 代理的行为次优，我们可以期望的最好的就是以下

似乎我们可以为第二个节点设置任意值，例如它必须是-Episolon。它可以是任意范围的值，例如 Epsilon，在这种情况下我们会优化 Player A

1个回答

（使用 X 表示 epsilon，因为键盘）

这只是一个假设，但如果你有一个最大化代理和一个最小化代理，那么 A（最大化）的最佳结果是扫过棋盘（X,0），而 B（最小化）的最佳结果是（- X,0) 因为 B 正在最小化 A 的分数，而不是他们自己的分数。

然后，A 的最优结果会因次优因素而变得复杂，然后我们想象它接近于零。

但是，如果这个假设是真的，似乎有很多假设没有被阐明。

其它你可能感兴趣的问题