我从伯克利的人工智能课程中得出这个问题(也不确定它是否是正确的提问地点,所以我提前道歉) https://inst.eecs.berkeley.edu/~cs188/pacman/course_schedule.html
目前,我正在处理第 3 部分的作业。
我的问题是:问题(第 1 部分,问题 6)。为什么我们只能保证如果 Min 代理的行为次优,我们可以期望的最好的就是以下
似乎我们可以为第二个节点设置任意值,例如它必须是-Episolon。它可以是任意范围的值,例如 Epsilon,在这种情况下我们会优化 Player A