图像数据集的术语变化是什么意思?

数据挖掘 机器学习 神经网络 美国有线电视新闻网 图像分类
2022-03-14 07:35:19

我正在使用卷积神经网络,我发现我们经常需要在将图像输入网络之前对其进行预处理。特别是,我看到我们经常必须使用图像生成器进行图像增强。现在,在寻找关于我们为什么需要这样做的说明时,我看到了一篇文章,上面写着:

图像增强技术是通过使用水平/垂直翻转、旋转、图像亮度变化、水平/垂直移位等人为增加数据集中图像变化的方法。

我不明白的是数据集的变化是什么。

有人可以帮助我吗?提前致谢。

1个回答

假设您有两个不同的猫图像数据集:

数据集 1

  • 图像是在全日光下拍摄的。
  • 猫几乎总是覆盖整个图像。
  • 猫总是在图像的中心。

数据集 2

  • 这些图像是在不同的照明条件下拍摄的:一些在全日光下,一些在房间里,一些在夜间。
  • 猫离相机的距离不同,例如,有时猫只覆盖了图像的 20%。
  • 猫在图像中的不同位置,例如,有时猫在中间,但有时猫在右上角。

在这种情况下,我们会说Dataset 2 比 Dataset 1 具有更高的变化

通常,我们使用数据增强来模拟数据集中缺失的信息。例如,您可以降低数据集 1 中某些图像的亮度,以模拟猫在夜间的样子。或者您可以缩小以模拟猫从远处看的样子。请注意,包含所有相关信息的完美数据集根本不需要任何数据扩充。然而,收集数据的成本很高,而数据增强的成本很低。因此,我们几乎总是要增强。