数据挖掘 - 如何将 MNIST 训练数据集划分为子部分？ - 吾爱随笔录

数据挖掘机器学习深度学习咖啡极简主义

2022-02-22 10:14:41

背景：我正在尝试使用 Caffe 训练 MNIST 数据集的不同子样本（1 个模型用于 10,000 个样本，另一个模型用于 20,000 个样本，依此类推，直到一个模型用于所有 60,000 个训练样本）。

问题：如何对 60,000 个样本的训练数据集进行细分，保持训练文件的格式与最初发布在http://yann.lecun.com/exdb/mnist/上的格式相同（完整）

1个回答

我认为您可以只读取文件的每一行，它会为您提供一个数据点并将其写入输出文件。为所需的数据点数量运行循环。

其它你可能感兴趣的问题