Mask R-CNN 中的主干和头部架构如何工作?

机器算法验证 机器学习 深度学习 图像处理
2022-02-27 20:29:37

Mask R-CNN 的架构

在此图中,我们看到了两个转换。据说这些convs是全卷积网络(FCN)的一部分。在他们的论文 Mask R-CNN(He et al., 2018)中,他们提到了关于主干网(ResNets/Feature Pyramid Network)和模型的头部架构的一些内容。我只是想知道它们与 FCN 和图中的两个 conv 有什么关系。这张图也是他们论文中的第一个图,以防你看不到。

1个回答

主干是指将图像作为输入并提取网络其余部分所基于的特征图的网络(主干的输出是图中的第一个块)。“head”指的是 RoI pooling 之后的所有内容——换句话说,就是您标记为 FCN 的内容。