人工智能 - 理性的定义是什么？ - 吾爱随笔录

理性的定义是什么？

人工智能定义智能代理棋理性简单反射代理

2021-10-20 02:40:16

我对理性的定义有点麻烦，比如：

如果代理在其当前知识的情况下最大化其绩效度量，则它是理性的。

我读过一个简单的反射代理不会在很多环境中理性地行动。例如，一个简单的反射代理在驾驶汽车时无法理性行事，因为它需要先前的感知才能做出正确的决定。

但是，如果它尽其所能利用所获得的信息，那不是理性行为吗，因为定义包含“鉴于其当前知识”？或者它更像是：“如果它存储了它曾经收到的所有知识，它在这一点上可能拥有的知识”？

关于合理性定义的另一个问题：国际象棋引擎是合理的，因为它在允许使用的时间内选择最佳移动，还是不合理，因为它实际上并没有（总是）找到最佳解决方案（需要更多时间这样做）？

2个回答

当我们在人工智能中使用理性一词时，它往往符合理性代理的博弈论/决策论定义。

在已解决或易于处理的博弈中，智能体可以具有完美的理性。如果博弈是棘手的，理性必然是有限的。（这里，“游戏”可以指任何问题。）

还有不完全信息和不完全信息的问题。

理性不仅限于客观最优决策，还包括主观最优决策，其中最优性只能被假定。（这就是为什么在 1-shot Prisoner's Dilemma 中背叛是最优策略，代理人不知道竞争对手的决策过程。）

这里的理性符合罗素和诺维格的定义，它与环境中的表现有关。

在一个环境中可能是理性的东西在不同的环境中可能不是理性的。此外，从具有更多知识的代理或学习代理的角度来看，对于简单的反射代理来说可能是局部合理的将不会显得合理。

以先验选择的形式进行交流的迭代困境可以提供一个类比。一个总是背叛的代理人，即使在竞争对手表现出合作意愿的情况下，也可能不被认为是理性的，因为背叛与合作代理人并没有最大化效用。一个简单的反射代理没有能力改变它的策略。

然而，在最一般意义上使用的理性可能允许，对于做出决策的代理，如果该决策是基于实现一个目标，并且该决策是利用该代理可获得的信息达成的，则该决策可以被视为理性的，而不考虑实际的最优性。

我读过一个简单的反射代理不会在很多环境中理性地行动。例如，一个简单的反射代理在驾驶汽车时无法理性行事，因为它需要先前的感知才能做出正确的决定。

我不会说对先前感知的需要是简单的反射代理不理性行事的原因。我想说简单反射代理的更严重的问题是它们不执行长期计划。我认为这是导致他们并不总是理性行事的主要问题，这也与您提供的理性定义一致。基于反射的代理通常不涉及长期计划，这就是为什么它实际上并不经常根据它所拥有的知识做得最好。

关于合理性定义的另一个问题：国际象棋引擎是合理的，因为它在允许使用的时间内选择最佳移动，还是不合理，因为它实际上并没有（总是）找到最佳解决方案（需要更多时间这样做）？

像极小极大这样的算法在其“最纯粹”的公式中（对搜索深度没有限制）对于象棋这样的游戏来说是合理的，因为它会以最佳方式下棋。但是，这在实践中是不可行的，运行时间太长。在实践中，我们将运行具有搜索深度限制的算法，以确保它们停止思考并在合理的时间内选择动作。这些不一定是理性的。这又回到了周公在他的回答中描述的有限理性。

但是，如果我们尝试用“在允许使用的时间内选择最佳移动”的方式来谈论这个问题，这个故事就不是很清楚了，因为在一定的时间内，什么是可能的或不可能的，很大程度上取决于因素如：

我们选择实现的算法
我们硬件的速度
执行效率/使用的编程语言
等等。

例如，假设我可以说我实现了一个算法，该算法需要一个预先计算好的最优解的数据库，而该算法只是在数据库中查找解并立即执行最优动作。即使给定非常有限的时间，这样的算法也将能够真正是理性的。在实践中很难实现，因为我们一开始就很难构建这样的数据库，但算法本身是明确定义的。所以，你不能在你对理性的定义中真正包含“考虑到允许使用的时间”之类的东西。

其它你可能感兴趣的问题

上一篇给所有奖励添加一个常数会改变情节任务中的最优策略集吗？下一篇哪些功能不能神经网络有效学习？