数据挖掘 - 神经网络中权重矩阵的维数 - 吾爱随笔录

数据挖掘机器学习

2021-09-19 02:30:15

为什么会出现维度 $w^{[2]}$ 是 $(n^{[2]}, n^{[1]})$ ?

这是一个简单的线性方程， $z^{[n]}= W^{[n]}a^{[n-1]} + b^{[n]}$

屏幕截图中似乎有错误。重量， $W$ 应该转置，如果我错了，请纠正我。

$W^{[2]}$ 是分配给第 2 层神经元的权重

$n^{[1]}$ 是第 1 层的神经元数量

1个回答

屏幕截图中似乎有错误。重量， $W$ 应该转置，如果我错了，请纠正我。

你错了。

矩阵乘法的工作原理是，如果将两个矩阵相乘， $C = AB$ ，在哪里 $A$ 是一个 $i \times j$ 矩阵和 $B$ 是一个 $j \times k$ 矩阵，则 C 将是 $i \times k$ 矩阵。注意 $A$ 的列数必须相等 $B$ 的行数 ( $j$ ）。

在神经网络中， $a^{[1]}$ 是一个 $n^{[1]} \times 1$ 矩阵（列向量），和 $z^{[2]}$ 需要是一个 $n^{[2]} \times 1$ 矩阵，以匹配神经元的数量。

所以 $W^{[2]}$ 必须有尺寸 $n^{[2]} \times n^{[1]}$ 为了生成一个 $n^{[2]} \times 1$ 矩阵来自 $W^{[2]}a^{[1]}$

其它你可能感兴趣的问题