方差计算RELU函数(深度学习)

机器算法验证 数理统计 方差 随机变量 深度学习
2022-03-17 04:40:51

权重初始化对于现代深度学习很重要。要了解[1,2],我想了解以下内容:

E[x2]=0.5Var[y],

在哪里x=max(0,y),E[.]是期望,Var[.]方差,x,y是随机变量。我们猜测y均值为零并且围绕均值对称。

感谢您的解释/推导

ķ

[1] http://jmlr.org/proceedings/papers/v9/glorot10a/glorot10a.pdf

[2] http://arxiv.org/abs/1502.01852

1个回答

就积分而言,您有:

E[x2]=+max(0,y)2p(y)dy

其中部分对积分没有贡献y<0

=0+y2p(y)dy

我们可以将其写为整个实域上积分的一半(围绕 0 对称,并且假设围绕对称):y2p(y)0

=12+y2p(y)dy

现在在正方形中减去零,我们得到:

=12+(yE[y])2p(y)dy

这是

=12E[(yE[y])2]=12Var[y]