神经网络反向传播背后的神经元级数学是什么?

人工智能 反向传播 数学 资源请求
2021-10-27 11:29:45

我是人工智能领域的新手。我正在尝试用一种我找不到示例或预制库或教程的语言(Dart)创建一个神经网络。我试过在网上寻找一个严格的“香草”python 实现(没有第三方库),但我找不到任何东西。

我找到了一个单层实现,但它只使用矩阵完成,对于初学者来说非常神秘。

我已经理解了前馈之间的想法,一个神经元计算其输入的总和,添加一个偏差并激活它。

但是对于反向传播背后的数学,我找不到任何神经元级别的解释。(通过神经元级别,我认为将单个神经元的数学视为一系列操作,而不是将多个神经元视为矩阵)。

它背后的数学原理是什么?有没有适合初学者的学习资源?

1个回答

反向传播实际上比想象的要容易得多 -如果您对微积分和链式法则以及组合 2 个梯度向量的单一多变量微积分法则有基本的了解,您只需将它们相加即可。

这是我在互联网上找到的最好的背部道具演练。如果您在那之后仍然感到困惑,请随时问我任何进一步的问题。这也是我为一个简单的 CNN 制作的快速前向和后向传递示例(虽然只有几层,而且梯度只返回到滤波器 1 的通道 1)反向传播