用于特征选择的自动编码器网络不收敛

人工智能 自动编码器 学习率
2021-10-27 11:27:23

我正在训练一个不完整的自动编码器网络来进行特征选择。我在编码器和解码器网络中各使用一个隐藏层。ELU 激活函数用于每一层。对于优化,我使用的是 ADAM 优化器。此外,为了提高收敛性,我还引入了学习率衰减。该模型最初显示出良好的收敛性,但后来在几个时期的相同值范围内开始产生损失(12 位数),并且没有收敛。如何解决这个问题?

1个回答

诀窍是用每列中各自的均值和标准差对输入数据集值进行归一化。这大大减少了损失,我的网络现在训练效率更高。此外,标准化数据还可以帮助您更轻松地计算与每个输入节点相关的权重,尤其是在尝试找出变量重要性时。