如何构建一个能够查看任何类型的输入然后识别这些数据的性质的人工智能?
例如,能够进行图像分类、NLP 并对其他一些传感器做出反应的 AI。是否有可能构建一个能够识别它所看到的数据类型的人工智能,以便它可以将数据发送到正确的模型进行处理,类似于人脑知道如何将视觉信息发送到视觉皮层和听觉信息在别处?
在一个简单的场景中,我认为我们可以通过级联的图像分类器获得非常好的性能。例如 2 层,第一层识别图像是否包含狗和猫。下一层有两个不同的 CNN,一个被训练用于识别狗的品种,另一个用于识别猫。这样,一旦我们确定我们有一只狗,图像就可以发送到正确的 CNN。一个经过专门训练来检测品种的 CNN,因此比更通用的 CNN 更加健壮。有点像这个领域的专业人士。首先,人类确定他正在看一只狗,然后他咨询专业人士询问他的品种。
我想扩展这个想法,以便能够识别彼此完全不同的各种数据源。各种输入。有没有模型可以做到这一点?