数据挖掘 - 批量归一化方差计算 - 吾爱随笔录

在批量归一化中，训练阶段的方差计算由 ( $x_i$ 是训练批次中的各个元素的大小 $m$ )

$\sigma_B^2 = \frac 1m \sum_{i=1}^{m} (x_i - \mu_B)^2$
在哪里 $\mu_B = \frac 1m \sum_{i = 1}^{m}(x_i)$

在测试期间，我们计算相同的人口统计数据

$E[x] = E_B[\mu_B]$ 和 $Var[x] = \frac{m}{m-1}E_B[\sigma_B^2]$ （如您所见，人口方差的无偏估计是在测试期间计算的，因为我们正在构建模型来预测人口分布）

在训练阶段本身进行偏差校正并随后可以在没有 $\frac {m}{m-1}$ 修正系数。IE

培训期间：

$\sigma_B^2 = \frac 1{m-1} \sum_{i=1}^{m} (x_i - \mu_B)^2$
在哪里 $\mu_B = \frac 1m \sum_{i = 1}^{m}(x_i)$

在测试期间：

$E[x] = E_B[\mu_B]$ 和 $Var[x] = E_B[\sigma_B^2]$