我一直在阅读有关计算机视觉的更多信息,并且对 YOLO 和类似的深度学习架构感到困扰。
我感到困惑的是如何处理非类图像部分。特别是,我完全不清楚为什么 YOLO 不将图像的每个部分都视为可能的类。
实际上是什么设置了检测和分类的截止值?
我一直在阅读有关计算机视觉的更多信息,并且对 YOLO 和类似的深度学习架构感到困扰。
我感到困惑的是如何处理非类图像部分。特别是,我完全不清楚为什么 YOLO 不将图像的每个部分都视为可能的类。
实际上是什么设置了检测和分类的截止值?
YOLO 的输出是 (x,y,w,h,confidence,class)。置信度值表示矩形是否包含对象,当置信度低时,矩形是未分类的。
只有在高class
时才会使用该值。confidence