我的理解是 Faster RCNN 是一种用于执行目标检测的架构。它在图像中找到对象并对其进行分类。我的理解也是VGG-16、RESNET-50等……也可以在图像中找到物体并进行分类。VGG-16、RESNET-50 等...对象检测架构是否与 Faster RCNN 相同?我经常将 VGG-16、RESNET-50 等视为 Faster RCNN 的“骨干”,并且被文献严重混淆。提前致谢!
Faster RCNN 与 VGG-16、RESNET-50 等是否相同?
数据挖掘
神经网络
深度学习
更快的rcnn
vgg16
2021-10-08 12:10:34
2个回答
图像分类模型通常被称为特征提取和分类子模块的组合。其中不包括最后一层的整个模型称为特征提取器,最后一层称为分类器。 流行的图像分类模型有:Resnet、Xception、VGG、Inception、Densenet 和 Mobilenet。
对象检测模型更多地是不同子模型的组合,而不是单一的端到端连接模型,正如您所提到的,它更像是一种架构。目标检测模型包含特征提取模型、区域提议网络、分类和回归模型。这里将排除所有密集层的上述分类模型(Resnet50、VGG 等)用作特征提取器。
一些流行的目标检测模型是:基于区域的卷积神经网络(R-CNN)、空间金字塔池(SPP-net)、Fast R-CNN、Faster R-CNN、基于回归的目标检测器、YOLO(You only看一次),单发检测器(SSD)。
简短的回答 - 否
让我这样说——假设你有一些图像数据集。您需要对其执行任何深度学习任务(分类、对象检测、分割等)。
为此,您通常会执行以下步骤:
- 为每个输入定义标签
- 定义如何提取特征
- 定义您将如何使用特征和标签来执行监督学习
- 定义损失函数和优化器
- 定义训练和测试管道
VGG16、ResNet16 等都是架构。他们执行第二步 - 特征提取。
Faster-RCNN 表示专门为对象检测任务定义的所有 1-5 个步骤。
其它你可能感兴趣的问题