神经网络中输入和权重矩阵维度的约定?

数据挖掘 神经网络 矩阵
2022-02-16 05:02:00

我目前正在学习神经网络,我看到互联网上对权重和输入矩阵的维度的描述相互矛盾。我只是想知道是否有更多人使用的某些约定。

我目前用以下尺寸定义我的输入矩阵 X:

(MXN)

其中 m 是样本数,n 是特征数。

我用尺寸定义了我的重量矩阵:

(轴)

其中a是层中的神经元数量,b是最后一层中的神经元数量。

这是传统的还是我应该改变一些东西?

1个回答

我不会说它本身有这样的约定(如果有人对此有任何评论,我也想知道)。

我认为为了更清楚地说明图层的输入如何x与 weights 交互W,最好将尺寸定义如下:

  • x: (mxn)
  • W: (nxk)
  • 偏置项b:(k)

m 仍然是示例数。n 表示输入特征的数量,k 表示层中的中子数。

众所周知,我们将层的输出计算yWx + b因此,生成的输出矩阵将是 (mxk)