我正在尝试对从大型正射影像中获取的数据训练一种对象检测算法(即 YOLOv4 Scaled,Faster R-CNN)。假设我有一个班级,我用边界框标记整个正射影像。标记后,有没有办法将整个图像分割成指定像素大小(即 416x416 像素)的单个照片,同时保留边界框?我可以轻松地将照片切成指定的尺寸,但我遇到的问题是将边界框保留在这些新图像中。
这样,我就不会耗尽我的 GPU 的内存需求。
我正在尝试对从大型正射影像中获取的数据训练一种对象检测算法(即 YOLOv4 Scaled,Faster R-CNN)。假设我有一个班级,我用边界框标记整个正射影像。标记后,有没有办法将整个图像分割成指定像素大小(即 416x416 像素)的单个照片,同时保留边界框?我可以轻松地将照片切成指定的尺寸,但我遇到的问题是将边界框保留在这些新图像中。
这样,我就不会耗尽我的 GPU 的内存需求。
您可以缩小照片尺寸并将相应的框缩放到新尺寸 (416x416)。
或者,如果您想使用您的技术,您可以对图像进行切片,然后检查边界框是否位于切片中,然后根据您拍摄的切片重新定位它。
看看这个allimentations library。