我正在训练一个对象检测模型 (SSD300) 来检测和分类热图像中的身体姿势。
即使我有超过 2k 种不同的姿势,但背景变化不大(我只有 5 种不同的观点)。
我在这些图像上训练了我的模型(70% 用于训练,30% 用于验证)。
现在,我想在无偏数据集上评估模型。
我应该为此目的保留数据集的图像还是应该使用现实生活中的数据集?
(一个好的解决方案是拥有一个现实生活中的训练集,但我没有)
我尝试了这两种方法,但正如预期的那样,在类似的图片上评估时,mAP=0.9,在完全不同的图片上评估时,mAP=0.5。
额外问题:当我想向客户展示结果时,mAP 是一个相关的指标吗?(例如,如果我告诉他“我的模型的 mAP=0.7”,客户不明白)
精确召回 ? (但我必须选择一个姿势分类阈值......)