RNN 中的参数数量

数据挖掘 深度学习 rnn
2021-09-17 00:23:30

我正在使用一个基本的 RNN,如下图所示(比如翻译)。该模型具有以下结构:

st=tanh(Uxt+Wst1)ot=softmax(Vst)

  • 假设 m 是词汇量大小,n 是隐藏层的词汇量。
  • 如果 xt={0,1}m U 是一个 n×m 矩阵,那么 W 是 n×n 矩阵。
  • 如果 otRkstRn那么 V 是一个 k×n 矩阵。

这个 RNN 模型的 # 参数是什么?

一个基本的RNN

2个回答

实体 W 、 U 和 V 由 RNN 的所有步骤共享,这些是图中描述的模型中的唯一参数。因此,训练时要学习的参数数量 =dim(W)+dim(V)+dim(U).

根据问题中的数据,这=n2+kn+nm.

在哪里,

  • n - 隐藏层的维度
  • k - 输出层的维度
  • m - 输入层的维度

如果不包括偏见,这是正确的。通过包括偏差(bbH)。中的参数数量b等于输出的数量 (k) 和参数的数量bH等于隐藏层数 (n)。因此最终值为:

n2+n+n+ķn+ķ