神经元总输入的标准差

人工智能 神经网络 数学 概率分布
2021-10-26 22:53:29

Raul Rojas 的神经网络系统介绍,第 8.2.1 节计算隐藏神经元输出的标准差。

从:

σ2=i=0nE[wi2]E[xi2]

当我尝试我得到的是(E[xi2]=13wi[α,α]):

σ2=i=0nE[wi2]E[xi2]=[n(α(α))212][n13]=n2α219

σ=n2α219=nα13

但劳尔·罗哈斯总结道:

σ=13nα

我是否遗漏了用于节点输入的大数定律的一些含义?

感谢您的时间 :)

1个回答

如果 n 个具有相关权重的不同边w1,w2,...,wn指向这个节点,然后从区间中选择具有均匀概率的权重[α,α],该节点的预期总输入为

iwixi
. 根据大数定律,我们还可以假设节点的总输入具有高斯分布。

请注意,节点的输入是

w1x1+w2x2+...+wnxn

节点总输入的方差为:

σ2=i=1nE[wi2]E[xi2]=n(E[w12]E[x12])=n([(α(α))212][13])=nα219

因为输入和权重不相关。

我已取出总和并将其替换为n乘以输入和权重的方差——这是可以做到的,因为两者都是独立的,并且本身分布相同,并且彼此独立。方差w1与方差相同wn.

我是否遗漏了用于节点输入的大数定律的一些含义?

是的。

大数定律的含义:

注意随机变量 E(wixi)

E(in(wixi)2)
写成随机变量的乘积E(wi)E(xi)
i=1nE[wi2]E[xi2]
. 这只能在两个随机变量独立时才可以写。而期望和求和的切换是由于期望性质的线性关系我们如何在这里获得独立?LLN 前来救援。

这是因为 - 根据大数定律 -随机变量(总输入)服从正态分布,这意味着两个随机变量,即权重和输入也服从正态分布 -它也是假设两个随机变量不相关,因此它们是独立的。