人工智能 - 你能学习非线性函数中的参数吗？ - 吾爱随笔录

你能学习非线性函数中的参数吗？

人工智能深度学习深度神经网络

2021-10-27 22:52:23

在论文Nonlinear Interference Mitigation via Deep Neural Networks中，说明了以下网络。

网络结构是

网络参数为 $\theta = \{W_1^{1},...,W_1^{l-1},W_2^{1},...,W_2^{l-1},W^{l},\alpha_1,...,\alpha_{l-1}\}$ ，在哪里 $W_1$ 和 $W_2$ 是线性矩阵和 $\rho^{(i)}(x)=xe^{-j\alpha_i|x|^2}$ 是逐元素非线性函数 ( $i$ 是层的索引）。

我应该在哪里添加这个 $\rho^{(i)}(x)$ ? 是否可以学习参数 $\alpha$ ? 我认为它与激活函数的想法不同，因为它位于两个线性矩阵的中间......或者它可以添加为嵌入层吗？

1个回答

一般来说，您可以学习网络的任何参数，前提是您可以找到损失函数相对于所需参数的偏导数。鉴于 $\rho$ 假设是可微的（正如作者在论文中所说），您可以对参数取损失函数的偏导数 $\alpha$ .

在本文中， $\rho$ 是一个非线性函数（即非线性函数，例如sigmoid 函数），它按元素应用于其输入。所以，如果你将一个向量传递给这个 $\rho$ ，你会得到一个相同形状的向量。作者没有明确地将其称为“激活函数”，但 $\rho$ 执行激活函数的类似工作，即它引入了非线性。此外，在这个架构中， $\rho$ 后面还有一个矩阵。一般来说，这是不被禁止的，即使它并不常见。

通常，在神经网络的每一层中，您可以有几个不同的可学习参数或权重。如果您可以区分损失函数，则参数是可学习的。您可以拥有多个权重矩阵。例如，循环神经网络通常具有与每一层相关联的多个权重矩阵：一个矩阵与前馈连接相关联，另一个矩阵与循环连接相关联。

其它你可能感兴趣的问题

上一篇机器学习能否做出符合人类质量或更好的经济决策？下一篇在与对手的游戏中训练演员评论算法