神经网络中权重矩阵的维数

数据挖掘 机器学习
2021-09-19 02:30:15

为什么会出现维度 w[2](n[2],n[1]) ?

这是一个简单的线性方程, z[n]=W[n]a[n1]+b[n]

屏幕截图中似乎有错误。重量,W 应该转置,如果我错了,请纠正我。

W[2] 是分配给第 2 层神经元的权重

n[1] 是第 1 层的神经元数量

Andrew Ng 深度学习课程视频截图

反向传播算法

1个回答

屏幕截图中似乎有错误。重量,W 应该转置,如果我错了,请纠正我。

你错了。

矩阵乘法的工作原理是,如果将两个矩阵相乘,C=AB, 在哪里A是一个i×j矩阵和B是一个j×k矩阵,则 C 将是i×k矩阵。注意A的列数必须相等B的行数 (j)。

在神经网络中,a[1]是一个n[1]×1矩阵(列向量),和z[2]需要是一个n[2]×1矩阵,以匹配神经元的数量。

所以W[2]必须有尺寸n[2]×n[1]为了生成一个n[2]×1矩阵来自W[2]a[1]