这可能是一个不断发展的答案,因为从某种意义上说,这个问题是一个(有用的)兔子洞。如果我没有深入研究元游戏本身,我深表歉意,因为它有点超出我的范围,这是完美信息的非机会游戏,但我认为值得考虑相关不确定性的潜在问题对一般游戏。
有限理性*是一个有用的概念,因为它预先假定了计算难处理的条件。计算难处理性可以以多种形式引入游戏:
[有关我在随机性方面使用“量子”的更多详细信息,请参阅确定性游戏。]
博弈论的根本目的是为任何给定问题确定“最优”策略。我把最优放在引号中,因为最优是一个频谱,并且在计算难处理的条件下是主观的。
因此,我们无法知道AlphaGo是否发挥最佳,只能知道它在5 场比赛中有 4 场比李世石 发挥得更好。
这与井字游戏等强解游戏不同,在这种游戏中,我们可以完全确定选择是最优的,因为井字游戏的问题在计算上是易于处理的。
部分混淆可能是语义上的,因为这些概念是微妙而深刻的,并且需要语言,TS Eliot 可能会称之为“与文字和意义的无法忍受的搏斗”。(例如,我在上面使用了隐藏信息来避免区分不完整和不完整的信息。)
- 完美游戏通常被定义为一种策略,无论对手的选择如何,都能为参与者带来最佳结果。
因此,极小极大至关重要,并为博弈论提供了基础。
即使在信息不完全的博弈中,无论是“确定性”(Battleship)还是涉及“量子不确定性”(Prisoner's Dilemma),都有最优策略。对于诸如Dilemma 和所有众多扩展minimax之类的同步游戏。在 Battleship 中,至少存在三种增加最优性的策略,尽管似乎没有一种策略可以产生 P > .5,但如果一个玩家采用更最优的策略,他们将在总和上获胜。甚至Rock, Paper, Scissors 似乎也有一个最佳策略,这让我大吃一惊,并提醒我需要更多地研究它。
- 因此,按照定义,完美游戏当然是可以实现的,但并不一定意味着(客观地)最优选择,这有点令人困惑,因为“完美”意味着客观性,这种情况只有在可处理的问题中才有可能。
同样重要的是要注意,可能没有比对手更好的“获胜”策略,在这种情况下,完美或最佳的打法就是减轻损失。
*具体而言,就不完全信息博弈而言,我认为有理由将有限理性的概念扩展到包括无法观察或“知道”的信息。
通俗地说,这将包括“未知”(已知和未知)和“不可知”(量子不确定性和叠加)。