用于训练神经网络的图像类型

数据挖掘 深度学习 训练
2021-09-23 06:12:51

我是神经网络的新手。

看到这篇文章Object detection with deep learning and OpenCV。这三类神经网络入围文章

  1. 更快的 R-CNN
  2. 你只看一次 (YOLO)
  3. 单次检测器 (SSD)

找到了很多有助于理解神经网络实际工作原理的在线资源。

由于从头开始构建神经网络非常耗时,而且要获得所需的效率并非万无一失。

我遇到了这些文章迁移学习和在深度学习中使用预训练模型的艺术迁移学习迁移学习,我们将学习从现有的预训练网络转移到训练我们希望网络检测的对象。

所有这些预训练的网络都经过了来自 COCO 或 ImageNet 或 PASCAL VOC 的数据的训练,这些数据包含不同类别的图像。

示例案例:

我想训练其中一个来计算这张图片中香蕉的数量在此处输入图像描述

我的香蕉图像训练集应该如何?

我需要输入网络的图像的固定分辨率,所以我什至可以像这样喂半根香蕉来训练吗?我不必删除背景进行训练。如果我错了,请纠正我。

在此处输入图像描述

2个回答

您应该阅读同一作者的这篇文章它是关于如何使用 Google 的搜索、一些 javascript 和一些 python 构建一个学习数据集。

这里的想法是收集尽可能多的对象图片(对象 = 香蕉),然后让深度学习网络比较并学习将它们与来自一些免费数据库的大量随机图像区分开来。

我想背景或部分图像变化都可以。当评估整个一堆时,您无法知道对象的哪个部分是可见的。

数据需要适合相同的大小,至少 Adob​​e有一些工具可以做到这一点。

希望这可以帮助

对 PASCAL Visual Object Classes Challenge 2007图像数据的存储方式进行了一些研究之后。这是我能找到的。

他们遵循每个图像的注释,该注释创建该特定图像的 xml 文件,其中包含这些详细信息PASCAL Visual Object Classes Challenge 2007 (VOC2007) Annotation Guidelines

这是其中一张图片的 VOC2007 中的 xml 文件示例

图片

在此处输入图像描述

XML

<annotation>
<folder>VOC2007</folder>
<filename>000001.jpg</filename>
<source>
    <database>The VOC2007 Database</database>
    <annotation>PASCAL VOC2007</annotation>
    <image>flickr</image>
    <flickrid>341012865</flickrid>
</source>
<owner>
    <flickrid>Fried Camels</flickrid>
    <name>Jinky the Fruit Bat</name>
</owner>
<size>
    <width>353</width>
    <height>500</height>
    <depth>3</depth>
</size>
<segmented>0</segmented>
<object>
    <name>dog</name>
    <pose>Left</pose>
    <truncated>1</truncated>
    <difficult>0</difficult>
    <bndbox>
        <xmin>48</xmin>
        <ymin>240</ymin>
        <xmax>195</xmax>
        <ymax>371</ymax>
    </bndbox>
</object>
<object>
    <name>person</name>
    <pose>Left</pose>
    <truncated>1</truncated>
    <difficult>0</difficult>
    <bndbox>
        <xmin>8</xmin>
        <ymin>12</ymin>
        <xmax>352</xmax>
        <ymax>498</ymax>
    </bndbox>
</object>

这是注释工具labelImg的链接,可以帮助您xml为自己的数据集中的图像生成类似文件

有关如何将图像数据划分为train和的更多详细信息trainval请查看此PASCAL Visual Object Classes Challenge 2007 (VOC2007) Development Kittestval