为什么需要通过 maxpool 和 relu 进行反向传播?
反向传播的目的是更新权重,而另一方面 maxpool 和 relu 只对输入执行简单的操作。它们实际上没有任何权重或任何过滤器。那么为什么需要通过它们进行反向传播呢?
为什么需要通过 maxpool 和 relu 进行反向传播?
反向传播的目的是更新权重,而另一方面 maxpool 和 relu 只对输入执行简单的操作。它们实际上没有任何权重或任何过滤器。那么为什么需要通过它们进行反向传播呢?
为什么需要通过 maxpool 和 relu 进行反向传播?
输入通过的任何可微函数(最大池和relu)都将具有梯度。非线性函数仍然是函数,因此链式法则在这里仍然适用...因此我们有梯度流过它们。这个梯度将必须反向传播...