我正在尝试使用神经网络(ANN)预测复杂系统的结果。结果(相关)值介于 0 和 10,000 之间。不同的输入变量具有不同的范围。所有变量都大致呈正态分布。
我在训练之前考虑了不同的选项来扩展数据。一种选择是通过使用每个变量的均值和标准偏差值独立计算累积分布函数,将输入(独立)和输出(因)变量缩放到 [0, 1] 。这种方法的问题在于,如果我在输出端使用 sigmoid 激活函数,我很可能会遗漏极端数据,尤其是那些在训练集中没有看到的数据
另一种选择是使用 z 分数。在那种情况下,我没有极端的数据问题;但是,我仅限于输出的线性激活函数。
与 ANN 一起使用的其他公认规范化技术是什么?我试图寻找关于这个主题的评论,但没有找到任何有用的东西。