随着最近一些 AI 领域(例如自动驾驶汽车)的严重限制的揭露,我注意到神经网络的行为与更简单的模型中的错误相同,即它们在测试数据上的准确率可能约为 100%,但是,如果你输入一个与训练过的任何东西略有不同的测试样本,它可能会完全关闭神经网络。自动驾驶汽车似乎就是这种情况,其中神经网络错误分类修改/涂鸦的停车标志,无法应对雨或雪花,或出现在路上的鸟等。这是以前从未见过的独特气候可能导致它做出完全不可预测的预测。这些具体的例子可以通过修改停车标志或雨和鸟的训练来规避,但这避免了这一点:NN' 当涉及到对其训练样本完全独特的环境进行泛化时,s 似乎非常有限。考虑到神经网络的训练方式,这当然是有道理的。
目前的解决方案似乎是手动找出这些混淆网络的新事物,并将它们标记为额外的训练数据。但这根本不是人工智能。这不是“真正的”概括。
我认为部分问题归咎于“人工智能”一词本身。当我们所做的只是在过度拟合我们的训练数据之前,在某个完美点找到理论理想函数的全局最小值时,很明显,神经网络无法泛化超过其训练集中可能的泛化能力。
我认为可能解决这个问题的一种方法是:神经网络不是静态的“一次唯一的计算”,而是可以记住他们所做的最后一两个预测,然后是他们当前的预测,并使用结果然后做出更准确的预测。换句话说,一种非常基本的短期记忆形式。
通过这样做,神经网络也许可以看到雨滴或雪花不是静态物体,而只是移动的噪音。它可以通过查看最后几个预测并查看这些对象如何移动来确定这一点。当然,这将需要巨大的额外计算开销,但我只是在展望未来,当处理能力增加时,NN 会如何进一步发展。类似于几十年前已经定义的神经网络,但由于缺乏计算能力而没有被广泛采用,这是否与短期记忆之类的情况相同?我们缺乏实际的计算能力,但也许我们可以在未来一段时间内以某种方式在理论上实现它,当我们确实拥有它时。
当然,这种短期记忆只有在分类与之前的分类相关时才有用,比如自动驾驶汽车。了解几秒钟前在现实生活中驾驶时观察到的情况很重要。同样,对于神经网络来说,了解几个实时分类之前预测的内容可能很重要。这也可能在对象检测中有用:也许,可以为远处的移动图形学习表示。速度现在可以成为隐藏层中的一种表示,并用于帮助识别远处的物体,这在使用一组单个静态权重时是不可能的。
当然,这整个事情将涉及以某种方式解决在最新样本的实时模型上训练权重的问题。或者,或者,权重可能仍然保持静态,但我们会使用两个或三个不同的权重模型来以某种方式表示时间。
尽管如此,我还是不禁将某种形式的短期记忆视为一种要求,如果 AI 要不“那么愚蠢”,当它观察到独特的事物时,如果它要根据时间和最近的观察。
我很好奇是否有任何研究论文或其他来源使用多个最近的分类或其他可以被认为是短期记忆的东西来探索整合时间的任何方面,以帮助达到神经网络更一般的泛化形式不一定在其训练中看到,即使其能够使用时间作为帮助它这样做的特征来避免噪声,或者使用来自多个最近分类的时间作为估计速度并将其用作特征的方法?
我很感激答案包括一些具体的实验或方法,关于如何将这类东西添加到神经网络(或将其列为来源),或者如果这不是一个积极研究的领域,为什么不呢。