你能学习非线性函数中的参数吗?

人工智能 深度学习 深度神经网络
2021-10-27 22:52:23

在论文Nonlinear Interference Mitigation via Deep Neural Networks中,说明了以下网络。

网络结构是神经网络结构

网络参数为θ={W11,...,W1l1,W21,...,W2l1,Wl,α1,...,αl1}, 在哪里W1W2是线性矩阵和ρ(i)(x)=xejαi|x|2是逐元素非线性函数 (i是层的索引)。

我应该在哪里添加这个ρ(i)(x)? 是否可以学习参数α? 我认为它与激活函数的想法不同,因为它位于两个线性矩阵的中间......或者它可以添加为嵌入层吗?

1个回答

一般来说,您可以学习网络的任何参数,前提是您可以找到损失函数相对于所需参数的偏导数。鉴于ρ假设是可微的(正如作者在论文中所说),您可以对参数取损失函数的偏导数α.

在本文中,ρ是一个非线性函数(即非线性函数例如sigmoid 函数),它按元素应用于其输入。所以,如果你将一个向量传递给这个ρ,你会得到一个相同形状的向量。作者没有明确地将其称为“激活函数”,但ρ执行激活函数的类似工作,即它引入了非线性。此外,在这个架构中,ρ后面还有一个矩阵。一般来说,这是不被禁止的,即使它并不常见。

通常,在神经网络的每一层中,您可以有几个不同的可学习参数或权重。如果您可以区分损失函数,则参数是可学习的。您可以拥有多个权重矩阵。例如,循环神经网络通常具有与每一层相关联的多个权重矩阵:一个矩阵与前馈连接相关联,另一个矩阵与循环连接相关联。