在神经网络中,网络中的每个神经元代表输入的非线性特征的一部分。例如:就像在 mnist 数据中一样,考虑数字 9 的茎被切割成多个部分,不同的部分由第一个隐藏层中的不同神经元表示(只是 3B1B 神经网络视频中的一个例子)。我的问题是:
是什么决定了哪个神经元代表茎的哪个部分?
如果我们多次传入相同的输入,是否有可能每个神经元可以代表茎的不同部分?或者这就是链式法则的全部魔力(即,一开始,所有神经元都代表一些垃圾特征,并且随着权重的更新,然后特定特征已经成为特定神经元的同义词。)如果是这样,这是怎么发生的?
提前致谢