在一些教程中,我发现有人说“Xavier”权重初始化(论文:了解训练深度前馈神经网络的难度)是初始化神经网络权重的有效方法。
对于全连接层,这些教程中有一条经验法则:
其中是层权重的方差,用正态分布和初始化,是父层和当前层中的神经元数量。
卷积层是否有类似的经验法则?
我正在努力找出初始化卷积层权重的最佳方法。例如,在权重形状为 的层中(5, 5, 3, 8)
,因此内核大小为5x5
,过滤三个输入通道(RGB 输入)并创建8
特征图......是否会被3
视为输入神经元的数量?或者更确切地说75 = 5*5*3
,因为输入是5x5
每个颜色通道的补丁?
我会接受两者,一个澄清问题的具体答案或更“通用”的答案,解释找到正确的权重初始化并最好链接源的一般过程。