在神经网络中,每个神经元都会被激活。但是激活是什么意思?
它只是产生最终结果的时间价值,还是与我们对问题的理解有关?
例如,考虑使用神经网络从图片中识别手写字符,我想知道神经元的激活是否有可能表示像素如何匹配图片中一小部分的特定值?
在神经网络中,每个神经元都会被激活。但是激活是什么意思?
它只是产生最终结果的时间价值,还是与我们对问题的理解有关?
例如,考虑使用神经网络从图片中识别手写字符,我想知道神经元的激活是否有可能表示像素如何匹配图片中一小部分的特定值?
神经元的激活在数学上只不过是其输入的函数。考虑一个具有一个隐藏层和一个输入向量的神经网络. 输入神经元可以写成:
.
神经元的激活然后是一个转变的输入。例如,可以使用 sigmoid 激活函数
权重选择是为了最小化损失函数,而不是为了解释。然而,人们可以尝试将神经元的激活解释为输入的内部表示。我见过的最好的例子之一来自Rummelhart 等人 (1986),图 4。在那篇论文中,两个家谱被输入到神经网络中。家谱代表了一个由三代人组成的意大利语和英语家庭。除此之外,当激活树的一个名称时,神经元活动代表这个人是来自英国还是意大利树,以及这个人体现了哪一代。