所以我正在做这里找到的 tensorflow 教程:
https://www.tensorflow.org/tutorials/keras/basic_classification
基本上,我的输入是一个 [28x28] 矩阵(图像),我将其展平为 [1x784] 向量。
然后教程说:
在馈送到神经网络模型之前,我们将这些值缩放到 0 到 1 的范围。为此,将图像组件的数据类型从整数转换为浮点数,然后除以 255。
我的问题是为什么我们需要在这种情况下进行标准化?我的理解是,当我们有不同尺度的特征时,如果模型的输出没有失真,我们就需要归一化。但在这种情况下,所有像素范围都从 0 到 255(所有特征都是相同的比例)
我继续使用归一化运行它,并获得超过 85% 的准确度,而没有归一化,我的准确度下降到 10%。
有任何想法吗?