如何在CNN中排列图像数据集?

数据挖掘 深度学习 喀拉斯 张量流 计算机视觉 卷积神经网络
2022-03-08 16:54:00

如何在 CNN 中排列图像数据集?我应该将每个图像类别放在一个单独的文件夹中吗?还是全部在同一个文件夹中?图像名称应该是类别名称吗?

我想看一个图像数据集(MNIST 除外)的示例。

谢谢你。

1个回答

像dogscats / 中的目录结构。(至少我保持这种方式)

dogscats

    |-- train

          |-- cats

                |-- catpic0, catpic1, …

          |-- dogs/

                |-- dogpic0, dogpic1, …

    |-- valid

          |-- cats

                |-- catpic0+x, catpic1+x, …

          |-- dogs

                |-- dogpic0+x, dogpic1+x, …

    |-- test

           |-- catpic0+x+y, catpic1+x+y, dogpic0+x+y, dogpic1+x+y

还要小心文件的命名..

另请注意,您将需要图像名称和类的映射,就像 CSV 或其他东西一样......

也没有全球接受的目录结构,它完全取决于您将使用的 API...

什么是好的训练/验证/测试拆分?(取决于您的数据集大小)

  • 可以做   (训练/验证)80/20

如果您已经或正在创建“测试”拆分,请使用(训练/验证/测试):

  • 可以做 80/15/5
  • 可以做 70/20/10
  • 可以做 60/20/20

请记住,唯一的目标是最终在测试集上进行泛化......