什么时候不归一化输入值具有更高的准确性?

数据挖掘 分类 正常化 深度学习
2022-03-09 17:07:06

现在我正在为一个二元分类问题训练一个深度神经网络,它具有一组胜率。因此,每个胜率大于或等于 0 但小于 100。

在没有对输入数据进行归一化的情况下,我一直在获得有希望的结果,直到我对其进行归一化并获得了令人震惊的更差准确性。

输入特征是一个大小为 20 的二维矩阵,网络有四层,每层有不同数量的节点。我对隐藏层使用 sgd 优化器和 ReLU 激活,对输出层使用 softmax 激活函数。

我想知道的是为什么我在没有标准化的情况下使用神经网络得到更好的结果?是因为输入归一化后的网络所需的最优超参数与未归一化时不同吗?

2个回答

我想知道的是为什么我在没有标准化的情况下使用神经网络得到更好的结果?

从理论上讲,对输入进行归一化不应影响准确性,因为 NN 可以收敛到任何输入值范围。

我们在使用 NN 时对数据进行归一化的原因是它提供了一些有用的属性,主要是关于收敛和收敛速度。您可以在此处阅读更多详细信息

是因为输入归一化后的网络所需的最优超参数与未归一化时不同吗?

是的,我认为这是你的问题。一些超参数可能针对常规输入进行了优化,并且可能不适用于标准化输入。这方面的一个例子可能是更高的学习率,这可能适用于更大范围的输入值,但不适用于标准化的值。

我相信标准化输入数据会降低计算成本,并且不会对您的性能产​​生任何影响。

话虽如此,标准化可能会帮助您在相同数量的迭代中获得更好的结果。但这并不意味着标准化会带来更好的性能。可能,您可以通过更多次数的迭代获得与原始数据相同的结果。