假设我有汽车的图像。对于数据集中的每张图片,我假设 3 张图片是同一辆车,但角度不同。
1)第一张图片是汽车的正面图片。2)第二张图片是那辆车从任一侧面看的照片。3) 第三张图片是那辆汽车的背面照片。
如果我有 1000 辆汽车,我将有 3000 张图像作为我的数据集。有没有办法找出汽车的哪个角度最能代表它的标签?换句话说,汽车图像的哪个角度最有助于确定特定图像是否是汽车?
我的想法是建立一个随机猜测模型来确定我们损失的下限,然后迭代地使用图像的每个角度作为训练,并在同一角度上进行预测并得出损失分数。例如:首先我用角度 1 的所有图像进行训练和预测,并得出一个损失分数。所以如果我有 3 个角度的图像,我最终会得到 3 个损失值。因此,损失分数最低的角度被确定为获胜者。但问题是,我不确定这种方法是否正确,因为如果我在数据集中有多个类,那么与任何其他非主导类相比,主导类的损失会更低,而且我们不会使用整个任何时间点的数据,因此最终可能会得出错误的结论。
感谢您提前回复。这个问题已经在我脑海中萦绕了很久。