具有单个逻辑单元隐藏层的神经网络用于多类分类问题:
并使用交叉熵误差进行训练:
我需要找到关于第一层参数的误差梯度,即最接近输入的层。输出目标是 one-hot 表示。yy
得到了这个附加信息: where
使用链式法则,
有关详细信息,您可以查看模式识别和机器学习第 5.3 节。