灰度和二进制 mnist 数据集之间的区别

数据挖掘 张量流 数据集 美国有线电视新闻网 极简主义 图片
2022-02-21 14:04:51

在制作 cnn 时,您可以使用包含灰度图像的经典 mnist 数据集。我正在考虑将它们转换为简单的二进制图像,问题是我应该吗?文件大小会小得多,并且更容易从背景中确定文本。为什么mnist数据集是灰度化的而不是二值化的?在 cnn 中应用二值化图像时会产生积极或消极的影响吗?

1个回答

MNIST 不是一个有趣的数据集。您使用 MNIST 来学习如何在有趣的数据集上进行机器学习。因此...

  1. 如果您只是想弄清楚如何为图像分类问题编写 Keras 代码,请随意使用图像中白色与非白色空间的 0/1 编码。它可能会降低计算需求,因此您可以更快地学习,而不必在计算机运行时等待。

  2. 这在处理有趣的数据集时可能无效。例如,如果铅笔只是刻划了一个像素,则该稍暗的空间几乎不会像真正的黑色像素一样被认为是暗的,但您的特征提取会将它们视为相同的。当您使用更有趣的数据时,这可能会混淆您的模型。