如何为 RetinaNet 或 YOLOv3 Paper 中的每个金字塔图提供地面实况?如何将特征金字塔映射到地面实况

人工智能 深度学习 计算机视觉 物体检测 物体识别 约洛
2021-11-10 00:01:46

所以YOLO V3RetinaNet都使用看起来像这样的特征金字塔:(在此处输入图像描述 除了be一个输出)

我只是混淆了预测和训练是如何完成的?我们必须给每个特征图一个不同的Y label吗?如果是,那怎么可能?在我看来,我们需要有N不同的基本事实。(我认为还会有 3 种不同的损失?)

如果没有,那么这些如何一次完成?

这些网络存在很多混乱,因为我无法理解 YOLOv3 和 RetinaNet 中如何提供、训练和预测 y 标签如果我知道这一点,那么关于损失、多输出等一切都会变得有意义。

0个回答
没有发现任何回复~