如何在 CNN 中排列图像数据集?我应该将每个图像类别放在一个单独的文件夹中吗?还是全部在同一个文件夹中?图像名称应该是类别名称吗?
我想看一个图像数据集(MNIST 除外)的示例。
谢谢你。
如何在 CNN 中排列图像数据集?我应该将每个图像类别放在一个单独的文件夹中吗?还是全部在同一个文件夹中?图像名称应该是类别名称吗?
我想看一个图像数据集(MNIST 除外)的示例。
谢谢你。
像dogscats / 中的目录结构。(至少我保持这种方式)
dogscats
|-- train
|-- cats
|-- catpic0, catpic1, …
|-- dogs/
|-- dogpic0, dogpic1, …
|-- valid
|-- cats
|-- catpic0+x, catpic1+x, …
|-- dogs
|-- dogpic0+x, dogpic1+x, …
|-- test
|-- catpic0+x+y, catpic1+x+y, dogpic0+x+y, dogpic1+x+y
还要小心文件的命名..
另请注意,您将需要图像名称和类的映射,就像 CSV 或其他东西一样......
也没有全球接受的目录结构,它完全取决于您将使用的 API...
什么是好的训练/验证/测试拆分?(取决于您的数据集大小)
如果您已经或正在创建“测试”拆分,请使用(训练/验证/测试):
请记住,唯一的目标是最终在测试集上进行泛化......