高分辨率未标记图像数据集上的船舶检测

数据挖掘 Python 喀拉斯 张量流 图像识别 物体检测
2022-02-25 08:52:53

我得到了一个包含 4000 张不同大小船舶进入港口的高分辨率照片的数据集 ,需要对这些照片进行聚类以执行以下任务

1)船舶检测

2)计算图像中的船只数量

3)查看船舶是否停泊

我是对象检测和图像识别的新手,所以我遇到了数据集没有标记的问题,所以我必须标记才能完成上述任务。我正在向面临类似问题的人寻求指导

1个回答

因此,问题在于如何检测图像中的船只,计算图像中的船只数量,并让模型预测船只是否停泊。

从您提出的问题来看,我认为我们最好实施有监督的机器学习。这意味着我们需要标记数据。为此,我建议对数据进行子样本,制作一个数据日志,将图像映射到标签(例如文件名,然后是船舶数量以及是否停泊。)。

在准备用于船舶检测的图像方面,最好通过在图像子集中在船舶周围绘制一个框来掩盖这些图像。

对于模型,显而易见的选择是遵循卷积网络,对于问题 2) 和 3),您可能需要使用 CNN 模型作为编码器,它将视觉信息编码为隐藏表示. 从这个隐藏的表示中,您将使用正常的前馈神经网络进行解码。

对于问题 2),您将让整个模型输出一个标量值,这将表示图像中有多少艘船。

对于问题 3),您将有一个最终的 2 节点 softmax 输出层,它将输出关于所识别的船舶是否停泊的概率分布。

我认为有人需要为我填写问题 1,因为我在语义分割方面没有太多经验(这基本上就是你的情况下的船舶检测)。