关于“深度学习”书中给出的批量标准化简单示例的问题

数据挖掘 深度学习
2021-10-11 15:56:24

在 Ian Goodfellow (章节链接)关于深度学习批量标准化的部分中,有以下文本:

例如,假设我们有一个每层只有一个单元并且在每个隐藏层不使用激活函数的深度神经网络: y=xw1w2w3wl. 这里,wi提供层使用的权重i. 层的输出ihi=hi1wi. 输出y是输入的线性函数x, 但权重的非线性函数 wi.

为什么 y 关于 w_i 是非线性的?

2个回答

我认为这句话的意思是当给定权重时 w1,...,wn 是固定的,输出与线性成正比 x,但正如它所提到的

权重 w_i 的非线性函数

给定一组权重(不止一个是变化的),它们不会线性相加以产生类似的输出

y=w1x1+...+wnxn

而是非线性的

y=w1w2..wnx (每个 wi 是超空间中的一个维度)

而且我认为从“输出与任何权重呈线性关系”的陈述中会变得更加清晰wi 但与权重非线性 wi”。

认为 w1=w2=...wn=w 然后 y=wn×x. 在这个意义上是y 的线性函数 x 和一个非线性函数 w.