我一直在阅读这本书,并正在尝试做练习。
问题是“连接正则化和权重初始化的改进方法”第 3 部分。我们必须使用启发式论证来证明“当权重下降到大约在哪里是网络中权重的总数。”
有关同一问题的更多上下文(第 1 部分和第 2 部分):
相关的等式似乎是这样的:
(这本书似乎使用了符号来表示两种不同的事物。我已经改变了它指训练集的大小,和指网络中权重的个数)
我觉得跟上个学期有关系, 因为如果我们替换然后整个术语简化为. 这意味着关于权重的偏导数变为代替. 这是否足以解释一旦权重出现,权重衰减就会下降?