视觉皮层如何共享卷积权重

人工智能 神经网络 卷积神经网络
2021-10-20 04:10:58

TL;博士

如果我们相信像卷积神经网络这样的视觉皮层功能,那么有一个问题让我摸不着头脑:脑力如何像卷积网络一样进行权重共享

好,多解释

显然,左视觉皮层没有办法直接告诉右视觉皮层“嘿,我学到了一些新东西,复制我!!” (或者有吗?)。那么,如果学习到的特征在视野中是多样的,它如何保持平移不变性呢?

例如,您已经知道英文字符,您可以用双眼识别它们。现在你想学点中文,同时锻炼你的右脑,所以你闭上了右眼,记住了一个新的汉字。之后,您当然可以仅用右眼识别新角色。但是为什么

答案可能是,对象/更高层次的特征检测发生在接收整个视野的更高层次的皮层中。可能还会发生一些迁移/一次性学习。但是,如果新生婴儿试图学习低级视觉特征,他/她肯定会面临体重分配问题。

一种可能的解释是,婴儿将接触大量数据并最终学习不变性。大量数据可以减少过拟合,但不能保证确定性收敛如果我们在相同的数据集上训练相同的 CNN 模型,但是使用不同的随机生成器种子,那么相同的特征检测器很可能会出现在不同的通道中,或者不同的特征集会以线性重组的形式出现。

如果没有办法共享权重,大脑会在整个视野中学习很多不同的特征组合,它如何仍然能够始终如一地解决视觉不变性问题?

1个回答

在人脑中,每个常见模式都被大量模式识别器(无论是神经元还是微柱)识别。这很明显,因为神经元一直在死亡,但我们不会醒来并且忘记如何识别字母“A”。事实上,我们必须取出相当大的新皮质,直到功能退化,这就是为什么阿尔茨海默病患者只有在大脑已经明显混乱时才会出现症状。

必须学习层次结构级别内的平移不变性。基本上,您需要在整个 V1 中使用相同边缘的过滤器。在您的视野中移动的对象只会在更高级别的表示中变得不变。不幸的是,我们并没有神奇地学习可以轻松转动和扭曲的表示,我们从不寻常的角度识别物体的能力随着角度的不寻常程度而降低。

一个很好的思想实验来说明这一点:想象一个立方体坐在你面前。现在向上拉立方体的一个角,直到立方体悬在你面前,一个角直接指向天花板,另一个角指向地面。现在用手指指出角的其余部分在哪里。

如果你和我一样,这真的很难。我想我第一次甚至没有意识到我必须指出六个角!

当然这是 3D,我们可能仍然具有内置的 2D 不变性,但事实证明,颠倒的面孔必须在皮质中进行更高的处理才能被识别为面孔等等......

关于跨视野学习许多不同的特征向量:这可能是由于新皮质通过预测(通过去极化)下一个模式来学习输入序列的事实而阻止的。因此,您可能会遇到这样的情况,即较高级别告诉较低级别有一个物体从左向右移动,而较低级别会预测它在 y 点检测到的边缘将在 y+x 点再次出现。

这种设置在两个方面与 NN 的训练不同:数据已经是平移的,并且可以预测平移,这有助于学习相同的特征。基本上,只要某物沿某个方向移动并且预测第二次出现,则彼此靠近的两个模式识别器一个接一个地获得几乎相同的模式,这意味着它更有可能被检测到,这意味着它将被学习。(我不想发表关于皮层的讲座,但这个预测很重要,因为它允许神经元更快地发射,这意味着它们在被横向抑制之前击败其他神经元,只有当它们真正发射时,它们才会学习。 )

作为免责声明,我想补充一点,这只是我目前对这个问题的理解,我很确定实际的解释更复杂。例如,我读过皮层的其中一层对于平移不变性很重要,而这一层只存在于接近感觉输入的水平。推测这一层(L4)不做序列预测的东西,所以也许有相同类型的输入就足够了,或者学习不同的特征向量实际上不是问题。还有一个复杂的问题是,皮质的不同层和不同层次之间的相互作用知之甚少。我建议问问神经科学家,但我认为他们还没有弄清楚这一点。