对于对象检测任务,我创建了一个小数据集来训练对象检测器。类频率或多或少是平衡的,但是我为每个图像定义了一些带有环境条件的附加属性,这导致类的分布相当不均匀,具体取决于所查看的属性(例如,类 X 与属性 A 和 B 一起出现)。
我使用了典型的训练/验证拆分,损失曲线让我得出结论,没有发生过拟合。我知道,通常应该使用具有真实特征分布的看不见的图像进行测试,但是由于数据集的大小,将额外的 10% 或 20% 用于测试或随机绘制示例会导致某些类组合和测试数据集中没有或几乎没有出现的属性和手动选择示例将非常耗时。
因此,我现在想知道,由于我没有看到过度拟合的迹象,因此使用整个数据集(train+val)来测试和计算性能指标是否合理?