多层网络的网络权重是否有命名约定?

人工智能 神经网络
2021-10-23 08:50:25

在下图中,虽然信息流是从输入层流向输出层,但权重的标注却是相反的。例如:对于从 X3 流向第四个隐藏层节点的箭头,其权重标记为 W(1,0) 和 W(4,3),而不是 W(0,1) 和 W(3,4),这表明数据从第 0 层的第 3 个节点流向第 1 层的第 4 个节点。

在此处输入图像描述

我的一位神经网络老师根本没有强调这个约定。另一位老师特别强调了这一点。

有没有理由有这样一个不直观的约定,真的有约定吗?

1个回答

当系统增长时使用矩阵表示法,作为a = Wx,作为a(隐藏层中激活函数的输入)和x(来自输入层的值)列向量,转置 (a1,a2,...a_m) 和 ( x1,x2,...,x_n) 和W是一个 m×n 矩阵,维数为 m 行 n 列。表示矩阵元素的标准方法是 w(i,j),其中“i”是行号,“j”是列号:

在此处输入图像描述 (来自维基

出于这个原因,从 x3 应用于 h4 的权重是矩阵 W 的第 4 行第 3 列中的元素,即 W(4,3)(正如您的老师所提倡的,但遗憾的是缺乏解释能力)。

在您的示例中:

在此处输入图像描述

注意:当 x1, x2, ... 本身是向量时,事情会更复杂一些,但最终结论是相同的。

(PS:紧急允许在此堆栈交换中使用乳胶表示法!)