我为具有两个突触前神经元的单个突触后神经元和 10000 个输入模拟了 Oja 规则和 BCM,其中我随机选择一个要么作为输入。我的学习率是我正在使用 BCM 的滑动阈值。(我正在关注本教程: http: //www.inf.ed.ac.uk/teaching/courses/nc/NClab8.pdf)但是,两种算法似乎收敛到非常不同的事物,如图所示:

轴是每个突触前神经元的权重,红色星星是我输入网络的两个输入。蓝色表示模拟的第一步,黄色表示模拟的最后一步。
我知道 Oja 的规则应该提取输入数据的第一个主成分(我认为这看起来更像 BCM,所以这让我感到困惑)。但真正让我感到困惑的是,权重收敛到非常不同的东西!这应该发生吗?为什么?我如何解释每种情况下的“最终”权重?
