我想推导参数 Relu 激活函数的反向传播函数,其定义如下:
我想导出这是一个标量,因为也是一个标量。我会开始推导:
但我不明白这最终如何产生一个标量。第一项是一个矩阵,而也是一个矩阵。在我在网上找到的解决方案中,它们只是对结果矩阵中的所有元素求和,但我认为这个双倍总和可以通过某种方式得出,而不是仅仅插入双倍总和。
我想推导参数 Relu 激活函数的反向传播函数,其定义如下:
我想导出这是一个标量,因为也是一个标量。我会开始推导:
但我不明白这最终如何产生一个标量。第一项是一个矩阵,而也是一个矩阵。在我在网上找到的解决方案中,它们只是对结果矩阵中的所有元素求和,但我认为这个双倍总和可以通过某种方式得出,而不是仅仅插入双倍总和。