我知道 YOLO (v1-5) 是一种实时对象检测模型,具有中等好的整体预测性能。我知道 UNet 和变体是高效的语义分割模型,它们也很快并且具有良好的预测性能。
我找不到任何资源来比较这两种方法之间的推理速度差异。在我看来,语义分割显然是一个更困难的问题,对图像中的每个像素进行分类,而不是对象检测,在图像中的对象周围绘制边界框。
有没有人有比较好的资源?或者一个很好的解释为什么一个在计算上比另一个要求更高?
我知道 YOLO (v1-5) 是一种实时对象检测模型,具有中等好的整体预测性能。我知道 UNet 和变体是高效的语义分割模型,它们也很快并且具有良好的预测性能。
我找不到任何资源来比较这两种方法之间的推理速度差异。在我看来,语义分割显然是一个更困难的问题,对图像中的每个像素进行分类,而不是对象检测,在图像中的对象周围绘制边界框。
有没有人有比较好的资源?或者一个很好的解释为什么一个在计算上比另一个要求更高?