Faster RCNN 与 VGG-16、RESNET-50 等是否相同?

数据挖掘 神经网络 深度学习 更快的rcnn vgg16
2021-10-08 12:10:34

我的理解是 Faster RCNN 是一种用于执行目标检测的架构。它在图像中找到对象并对其进行分类。我的理解也是VGG-16、RESNET-50等……也可以在图像中找到物体并进行分类。VGG-16、RESNET-50 等...对象检测架构是否与 Faster RCNN 相同?我经常将 VGG-16、RESNET-50 等视为 Faster RCNN 的“骨干”,并且被文献严重混淆。提前致谢!

2个回答

图像分类模型通常被称为特征提取和分类子模块的组合。其中不包括最后一层的整个模型称为特征提取器,最后一层称为分类器。 流行的图像分类模型有:Resnet、Xception、VGG、Inception、Densenet 和 Mobilenet。

对象检测模型更多地是不同子模型的组合,而不是单一的端到端连接模型,正如您所提到的,它更像是一种架构。目标检测模型包含特征提取模型、区域提议网络、分类和回归模型。这里将排除所有密集层的上述分类模型(Resnet50、VGG 等)用作特征提取器。
一些流行的目标检测模型是:基于区域的卷积神经网络(R-CNN)、空间金字塔池(SPP-net)、Fast R-CNN、Faster R-CNN、基于回归的目标检测器、YOLO(You only看一次),单发检测器(SSD)。

简短的回答 - 否

让我这样说——假设你有一些图像数据集。您需要对其执行任何深度学习任务(分类、对象检测、分割等)。

为此,您通常会执行以下步骤:

  1. 为每个输入定义标签
  2. 定义如何提取特征
  3. 定义您将如何使用特征和标签来执行监督学习
  4. 定义损失函数和优化器
  5. 定义训练和测试管道

VGG16、ResNet16 等都是架构。他们执行第二步 - 特征提取。

Faster-RCNN 表示专门为对象检测任务定义的所有 1-5 个步骤。