该博客涵盖了 LSTM 的基础知识。
遗忘门定义为:
在这一点上,线性代数让我更加困惑。的语法在这种情况下令人困惑。我认为一个向量应该进入激活函数,因为输出是一个向量,但上面遗忘门的语法意味着输入有列因为将是一个矩阵
为了举例,让我们说......
谁能给出进入 sigmoid 函数的最终向量?
我认为数学是
该博客涵盖了 LSTM 的基础知识。
遗忘门定义为:
在这一点上,线性代数让我更加困惑。的语法在这种情况下令人困惑。我认为一个向量应该进入激活函数,因为输出是一个向量,但上面遗忘门的语法意味着输入有列因为将是一个矩阵
为了举例,让我们说......
谁能给出进入 sigmoid 函数的最终向量?
我认为数学是
注意
是两个向量的串联。在您的示例中,它将是:
然后是尺寸将会, 在哪里是LSTM单元输出的维度,即激活, 你定义的维度.
因此,是维数矩阵的乘法由一个向量,这将返回一个维度向量. 然后将 sigmoid 函数逐点应用于结果的两个元素中的每一个。
希望这是有道理的。
我将其解释为
那是具有与条目一样多的列和. 也有尽可能多的行. 这将使维度匹配并产生向量输出。