我们如何使用无监督的深度神经网络预测图像中的内容?

数据挖掘 机器学习 图像分类 计算机视觉 图像识别
2022-02-15 09:10:16

根据我对用于图像分类的无监督 DNN 的理解:

  • 输入层是一个 4,096 维向量(用于 64 x 64 图像)
  • 隐藏层代表由反向传播识别的低得多的“特征”
  • 由于模型是生成的,输出层也是 64 x 64 的图像

因此,如果我们缺乏标记数据,我们如何预测新的未见过图像包含特定的图像类别(例如猫)?

1个回答

经过大量阅读,我想我现在明白了。我们真的需要建立 2 个模型。

模型 1

  • 无监督
  • 大量未标记的图像
  • 用于“学习特征”(即比我们通过多年研究手动完成的更好,例如边缘检测、颜色特征等)。

模型 2

  • 监督
  • 很少有标签的图像
  • 使用模型 1 作为“特征提取器”。即通过模型1传递训练图像并将输出层用作特征向量。
  • 使用相同的方法测试图像,例如模型 1 提取特征,然后使用第二个模型输出标签预测