数据挖掘 - 遵循官方 Tensorflow/Keras 教程，MNIST 时尚数据集的准确度为 0.1 - 吾爱随笔录

遵循官方 Tensorflow/Keras 教程，MNIST 时尚数据集的准确度为 0.1

数据挖掘 Python 喀拉斯张量流准确性极简主义

2021-10-12 14:35:22

我的目标是将产品图片分类为连衣裙、凉鞋等类别。

我正在使用 MNIST 时尚数据集，按照这个官方教程逐字逐句：https ://www.tensorflow.org/tutorials/keras/basic_classification所以我的代码与那里可以阅读的内容 100% 相同：

# TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt

print(tf.__version__)

fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation=tf.nn.relu),
    keras.layers.Dense(10, activation=tf.nn.softmax)
])

model.compile(optimizer=tf.train.AdamOptimizer(),
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])


model.fit(train_images, train_labels, epochs=5)

test_loss, test_acc = model.evaluate(test_images, test_labels)

print('Test accuracy:', test_acc)

问题：生成的准确度始终在 0.1 左右，远低于教程示例输出的 0.876。

我显然做错了什么，但我不知道是什么。如何将准确性提高到合理的程度？

我的输出：

$ python classify-products.py 
1.10.1
Epoch 1/5
2018-09-18 13:33:46.971437: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA
60000/60000 [==============================] - 3s 47us/step - loss: 13.0161 - acc: 0.1924 
Epoch 2/5
60000/60000 [==============================] - 3s 46us/step - loss: 12.8998 - acc: 0.1997
Epoch 3/5
60000/60000 [==============================] - 3s 46us/step - loss: 13.3386 - acc: 0.1724
Epoch 4/5
60000/60000 [==============================] - 3s 47us/step - loss: 12.9031 - acc: 0.1995
Epoch 5/5
60000/60000 [==============================] - 3s 47us/step - loss: 13.6666 - acc: 0.1521
10000/10000 [==============================] - 0s 26us/step
('Test accuracy:', 0.1005)

切换到 20 个 epoch 并不能提高准确性。

3个回答

您尚未标准化图像数据集，例如将像素值设置在 0-1 之间，这可以帮助分类器更快地收敛。

请执行以下操作。

train_images = train_images / 255.0

test_images = test_images / 255.0

您似乎将 50% 的数据用于训练和测试。尝试使用 7:3 比例的数据进行训练和测试。增加时代希望它会起作用。

我也遇到同样的问题。这是数据集错误。

我发现加载的训练数据集是 Fashion-MNIST 数据集，而测试数据集是 MNIST 数据集。

所以，我从官方网站https://github.com/zalandoresearch/fashion-mnist下载了原始的 Fashion-MNIST 数据集

问题在于 train_images 的标准偏差与第一个隐藏层的标准偏差之间的不匹配。0.05 来自Dense 层的内核初始化程序的默认标准。目标是使这些值彼此更接近，理想情况下处于相同的数量级（大约或小于 1.0）。

train_images.std()
>> 90.0
model.layers[1].get_weights()[0].std()
>> 0.05

255 不是一个神奇的数字。您也可以使用 100 或 1000。您还可以指定内核初始化程序的所需标准，以便它与您的数据的标准匹配。

例如，以下内容也将在 model.fit() 中实现所需的高精度。

train_images = train_images / 100.0  # std = 1.0
train_images.std()
>> 0.9

from tensorflow.keras import initializers
ki = initializers.RandomNormal(stddev=1.0)

model = keras.models.Sequential([
  keras.layers.Flatten(input_shape=[28,28]),
  keras.layers.Dense(300, activation="relu", kernel_initializer=ki), 
  keras.layers.Dense(100, activation="relu"),
  keras.layers.Dense(10, activation="softmax")
])

其它你可能感兴趣的问题

上一篇如何证明我的 CNN 自动编码器的瓶颈层包含有用的信息？下一篇GAN 与 DCGAN 的区别