我目前正在学习神经网络,我看到互联网上对权重和输入矩阵的维度的描述相互矛盾。我只是想知道是否有更多人使用的某些约定。
我目前用以下尺寸定义我的输入矩阵 X:
(MXN)
其中 m 是样本数,n 是特征数。
我用尺寸定义了我的重量矩阵:
(轴)
其中a是层中的神经元数量,b是最后一层中的神经元数量。
这是传统的还是我应该改变一些东西?
我目前正在学习神经网络,我看到互联网上对权重和输入矩阵的维度的描述相互矛盾。我只是想知道是否有更多人使用的某些约定。
我目前用以下尺寸定义我的输入矩阵 X:
(MXN)
其中 m 是样本数,n 是特征数。
我用尺寸定义了我的重量矩阵:
(轴)
其中a是层中的神经元数量,b是最后一层中的神经元数量。
这是传统的还是我应该改变一些东西?
我不会说它本身有这样的约定(如果有人对此有任何评论,我也想知道)。
我认为为了更清楚地说明图层的输入如何x与 weights 交互W,最好将尺寸定义如下:
x: (mxn)W: (nxk)b:(k)m 仍然是示例数。n 表示输入特征的数量,k 表示层中的中子数。
众所周知,我们将层的输出计算y为Wx + b。因此,生成的输出矩阵将是 (mxk)