我正在使用 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 的《深度学习》一书来学习神经网络。在第 7.1 节中,它说:
...我们通常选择使用参数范数惩罚 Ω,它仅惩罚每一层仿射变换的权重,并使偏差不正则化。与权重相比,偏差通常需要更少的数据才能准确拟合。每个权重指定两个变量如何相互作用。很好地拟合重量需要在各种条件下观察这两个变量。每个偏差只控制一个变量......
我不明白为什么它说
每个权重指定两个变量如何相互作用
有人可以解释一下吗?有一些例子就完美了。