我正在研究边界框定位问题,我需要检测特定对象是否在图像中,如果是,我需要回归边界框的坐标。目前,数据的标签被编码为 [x,y, width, height],其中 (x,y) 是对象存在时边界框左上角的坐标。当对象不存在时,所有 4 个特征都设置为 NaN。到目前为止,我添加了另一个二进制特征,当对象不存在时为零,当对象存在时为零。
我的问题是,当对象不存在时,我该如何处理 4 个数字特征?我不能将它们保留为 NaN,因为 5 个特征向量(二进制 + 4 个数字 / NaN)需要进入一个可微的损失函数。由于边界框的坐标和尺寸都是正数,我想知道将所有 4 个数值设置为一个大的负数是否可行,但我不确定。