如何将 MNIST 训练数据集划分为子部分?

数据挖掘 机器学习 深度学习 咖啡 极简主义
2022-02-22 10:14:41

背景:我正在尝试使用 Caffe 训练 MNIST 数据集的不同子样本(1 个模型用于 10,000 个样本,另一个模型用于 20,000 个样本,依此类推,直到一个模型用于所有 60,000 个训练样本)。

问题:如何对 60,000 个样本的训练数据集进行细分,保持训练文件的格式与最初发布http://yann.lecun.com/exdb/mnist/上的格式相同(完整)

在此处输入图像描述

1个回答

我认为您可以只读取文件的每一行,它会为您提供一个数据点并将其写入输出文件。为所需的数据点数量运行循环。