人工智能 - 为什么符号 AI 不像 ANN 那样流行，而是被 IBM 的 Deep Blue 使用？ - 吾爱随笔录

为什么符号 AI 不像 ANN 那样流行，而是被 IBM 的 Deep Blue 使用？

人工智能神经网络机器学习比较象征性的ai 深蓝

2021-11-13 05:09:27

每个人都在实施和使用 DNN，例如 TensorFlow 或 PyTorch。

我以为 IBM 的 Deep Blue 是一个基于 ANN 的 AI 系统，但这篇文章说 IBM 的 Deep Blue 是象征性的 AI。

符号 AI 中是否有任何特殊功能可以解释为什么 IBM 的 Deep Blue 使用它（而不是 ANN）？

3个回答

你可能还会问，我们使用神经网络是否有任何特殊原因。如果我们要训练神经网络下棋，我们需要能够：

1.将其位置作为输入向量（很简单），

2.决定输出格式。也许是可能移动的分布（但是，如何表示特定输出单元的含义不会根据棋盘状态发生巨大变化？或者相反，我们让候选棋步之后的结果棋盘状态为输入，并让输出是代表该状态可取性的分数。不过，这将需要成倍增加的前向/反向传播通道。

3.为它产生的任何输出向量提供一个错误信号。这是非常棘手的一点，因为直到最后我们都不知道给定的动作是否会导致胜利。

我们是否将游戏玩到最后，在进行过程中存储决策，然后在最后重播每个输入，如果我们输了就给它一个错误信号？这将给正确的动作带来与实际输掉比赛的相同的错误。如果有足够多的游戏，这会奏效，因为好的动作会比负数更频繁地得到积极的反馈，反之亦然。但这需要很多游戏。比人类更愿意玩。我们可以让不同的网络通过相互对抗来学习，但不是在 1996 年的硬件上。

我们是否会根据董事会状态的另一种启发式方法提供分数？在那种情况下，为什么不直接使用minimax呢？可以证明，对于给定的启发式算法，无论我们看起来有多深，它都是最佳的，并且不需要训练。

再加上这样一个事实，如果我们在每个步骤中都没有选择一个好的表示，那么网络很有可能只会学习它专门训练过的位置，而不是推广到看不见的状态，这是主要的首先使用神经网络的原因。

使用神经网络学习国际象棋当然是可能的（例如，可以在此处找到 DeepMind 的方法），但无论如何它们都不能自然地解决这个问题。相比之下，Minimax 非常适合这个问题，这就是为什么它是 Deep Blue 使用的技术之一。神经网络是一个了不起的工具，但它们并不总是适合这项工作的工具。

附录：我没有过多强调这一点，因为 KC 已经提出了这一点，但是训练大型神经网络需要我们执行大量的矩阵向量乘法，而这在 GPU 变得强大且便宜之前并不是特别实用。

我不确定任何智能机制都可以完全摆脱符号逻辑。

即使决策是基于统计的，采取行动的机器也必须包括某种形式：

IF {some condition}
THEN {some action}

至于新证明的统计人工智能方法（人工神经网络和遗传算法）的流行，这源于它们在更复杂的问题上表现出的更大效用，与专家系统（“老式人工智能”）相比，对于没有数学计算的问题解决方案。

（即 3x3 Tic-tac-toe 的统计方法是矫枉过正和不必要的 b/c 3x3 形式是一个已解决的游戏。但对于大订单的游戏板 $m*m$ 或者 $m*n$ ，n维博弈， $m^n$ ，除非有适用于所有变化的数学解决方案，否则人工神经网络是可行的。）

专家系统的主要问题，无论多么复杂，都是“脆弱性”——在没有人类程序员干预的情况下无法适应变化。随着条件的变化，该机制显示出效用递减，或者只是“中断”（例如无效输入。）

创建 DeepBlue 所需的人力是巨大的，这就是为什么它需要数十年才能实现目标，该目标由一家具有基础研究历史的大公司资助。

与可以训练以在极短的时间内实现相同目标的简单人工神经网络相比。

未来任何强度的通用人工智能都可能涉及统计人工智能编程和适应其自身的符号功能。

最后，符号 AI 的实施仍然比统计 AI 广泛得多，因为现代计算的所有基本功能、所有数学函数、所有传统软件和应用程序都使用符号逻辑，即使高级功能是统计驱动的. 情况可能总是如此。

因此，就什么方法最适合给定问题而言，它实际上取决于问题的性质/结构，它的可解决性甚至可判定性，以及它的易处理性。

今天使用的人工神经网络需要 1. 大量数据 2. 大量计算能力。在我们拥有上述两种方法之前，我们并不真正知道如何正确构建 ANN，因为我们没有足够的方法来训练网络，因此无法对其进行评估。

另一方面，“符号 AI”非常只是一堆 if-else/逻辑条件，很像常规编程。您无需过多考虑它的整个“象征”部分。主要/重大突破是你有很多聪明的“搜索算法”和相对于以前的大量计算能力。

重点是，当时的主要研究项目是象征性人工智能，人们并没有真正为“连接主义”方法而烦恼。

其它你可能感兴趣的问题

上一篇弱学习者如何在 boosting 中变得强？下一篇数据集的大小如何取决于假设类的 VC 维度？