所以我试图搜索但找不到任何答案。我想知道是否可以训练一个模型来检测照片中感兴趣的项目的数量,而无需使用边界框或点来定位训练集中的对象。
例如,假设我想计算照片中的街道电线杆之类的简单事物,是否可以仅将训练集中的照片和电线杆的数量作为目标。因此没有为训练数据目标标记的边界框或点。
所以我试图搜索但找不到任何答案。我想知道是否可以训练一个模型来检测照片中感兴趣的项目的数量,而无需使用边界框或点来定位训练集中的对象。
例如,假设我想计算照片中的街道电线杆之类的简单事物,是否可以仅将训练集中的照片和电线杆的数量作为目标。因此没有为训练数据目标标记的边界框或点。
有不同的方法可以实现您的目标:
1.) 仅提供图像中的对象数量以训练对象检测器。这称为弱监督或弱标签。
一些使用这种方法的作品:
https://arxiv.org/pdf/1711.05282.pdf:他们的方法是在图像提议上训练对象检测器以及对象计数。
https://hal.inria.fr/hal-02393688/file/1912.00384.pdf:可以通过为每张图像提供一个类别标签来训练对象检测器
2.)有几部作品专注于计算物体:
例如,以下作品专注于计算任意对象:
对于密度估计,有几项计算人的工作:
根据设置,它也可以用于您的应用程序,