如果 IQ 被用来衡量机器的智能,就像人类一样,那么在这个时间点,我们最智能的 AI 系统的 IQ 会是多少?
如果不是智商,那么如何最好地将我们的智力与机器进行比较,或者将一台机器与另一台机器进行比较?
这个问题不是问我们是否可以测量机器的智商,而是,如果智商是最首选或通用的测量智力的方法,那么人工智能与我们最接受的人类智力测量方法相比如何。
许多人可能不理解图灵测试与他们的新车或其他类型的智能机器的智能程度的相关性。
如果 IQ 被用来衡量机器的智能,就像人类一样,那么在这个时间点,我们最智能的 AI 系统的 IQ 会是多少?
如果不是智商,那么如何最好地将我们的智力与机器进行比较,或者将一台机器与另一台机器进行比较?
这个问题不是问我们是否可以测量机器的智商,而是,如果智商是最首选或通用的测量智力的方法,那么人工智能与我们最接受的人类智力测量方法相比如何。
许多人可能不理解图灵测试与他们的新车或其他类型的智能机器的智能程度的相关性。
这取决于智商测试的呈现方式:
如果对于人类(实际上,作为包含正在打开的测试问题的书籍视频等),那么所有人工智能程序都会得分为零。
如果将其作为监督学习问题的测试集(例如Bongard 问题),那么人们可能会想象一些 ML规则归纳技术(例如学习分类器系统、遗传编程)可能会取得一些有限的成功。
因此,所有当前的 AI 程序都需要以合适的方式“框定”问题。不用多想就能看出消除对这种“框架”的需求实际上是人工智能的核心问题,并且(尽管有一些关于深度学习的说法),消除框架仍然是一个遥远的目标。
更一般地说(就像图灵测试一样),为了使智商测试成为真正有意义的智力测试,它应该是程序能力的副作用,而不是人类设计它的特定目的.
有趣的是,我知道只有一个程序位于 1. 和 2. 之间:
Phaeaco(由Douglas Hofstadter 研究小组的Harry Foundalis开发)将Bongard 问题的嘈杂照片图像作为输入,并且(使用 Hofstadter 的“流体概念”架构的变体)在许多情况下成功地推导出了所需的规则。
在这个时间点,我们最智能的人工智能系统的智商是多少?
有许多不同类型的智商测试,包括书面、视觉和口头评估,但大多数问题都是基于涉及创造性思维和真正智力的抽象推理问题。
换句话说,计算机必须展示一些尚不存在的东西……“强人工智能”。
科幻小说中的智能计算机并不存在。完全没有。我们甚至不接近。我们完全不知道如何弥合我们现在可以做的与流行文化电影中所描绘的之间的差距。即使有自动驾驶的汽车和玩“围棋”的电脑——一只成绩不佳的蚊子拥有的认知智能比世界上所有的超级电脑……加起来还要多!
即使我们可以以它理解的风格和交付系统预先格式化问题,记忆、注意力或速度在计算机环境中意味着什么?我什至不确定标准化的智商测试在这种情况下是否有意义。这可能就像问计算机在拼字游戏中的表现。
用人的话说,我们是不允许带参考资料去查答案的;但是当参考查找是计算机固有的存在时,您如何纠正这一点?当存储是非易失性时,如何测量内存?这就涉及到一个关于学习和知识的本质与仅仅做很多笔记的存在主义问题。
不过,您甚至如何教计算机“哪种动物最不像其他四种动物”是什么意思?计算机真的从一般智力中找出了要问的问题,还是计算机只是专门设计用来解析智商类型的问题?如果您设计的东西预先知道可能会被问到什么,那么今天的计算机可能只是能够将其“识别”为问题式 496.527b 并插入变量。
但这不是我们使用或理解的任何定义的通用智能。它只是一个专门的、流畅的解释器,旨在解析出特定类型的标准化问题。问它一种出乎意料的问题,你会发现计算机根本没有表现出天生的智能。
在我们创造出强大的人工智能之前,计算机实际上是没有智商的。