机器算法验证 - Leaky ReLU 的导数是什么？ - 吾爱随笔录

Leaky ReLU 的导数是什么？

机器算法验证机器学习神经网络优化计算机视觉

2022-03-18 10:27:51

我正在阅读斯坦福关于该主题的教程，并且我已经达到了这一部分，“训练神经网络”。到现在为止还挺好。我几乎什么都懂。

我想用 Leaky ReLU 改变他在那里使用的 ReLU。我的问题是，我是否必须改变他进行反向传播的方式？如果我使用 Leaky ReLU，这些导数将如何变化？

有什么论文准确地说明了当我们有 Leaky ReLU 时如何完成 back prop？

2个回答

ReLU 的导数对于 x < 0 为 0，对于 x > 0 为 1。如果泄漏的 ReLU 对于负值具有斜率，例如 0.5，则对于 x < 0，导数将为 0.5，对于 x > 0，导数为 1。

对于某些，我们有泄漏的 relu除非，否则泄漏的 ReLU 函数在处不可微。 $c$ $f(x)$

\begin{aligned} f (x) & = {\begin{cases} x & x \geq 0 \\ c x & x < 0 \end{cases} \\ f^{'} (x) & = {\begin{cases} 1 & x > 0 \\ c & x < 0 \end{cases} \end{aligned} .

$\begin{align} f(x)&=\begin{cases} x & x \ge 0\\ cx & x<0 \end{cases}\\ f^\prime(x)&=\begin{cases} 1 & x > 0 \\ c &x<0 \end{cases} \end{align} .$

x = 0

$x=0$

c = 1

$c=1$

通常，选择。的特例是普通的ReLU，的特例只是恒等函数。选择意味着许多此类层的组合可能会呈现爆炸梯度，这是不希望的。此外，选择会使成为形状类似于的非单调函数。非单调函数最近变得越来越流行（例如，mish 和 swish），但我不知道对非单调泄漏 ReLU 的研究。 $0<c<1$ $c=0$ $c=1$ $c>1$ $c<0$ $f$ $V$

其它你可能感兴趣的问题

上一篇如何在 scikit-learn 的 roc_curve 函数中选择阈值的数量？下一篇如何区分偶发任务和连续任务？