我对感知器输出的几何解释非常感兴趣,主要是为了更好地理解网络真正在做什么,但我似乎找不到关于这个主题的太多信息。
我知道一个没有隐藏层的感知器可以看作是在两个类之间定义一个超平面,如果它们是线性可分的,它就可以正常工作。
然而,我发现更难理解多层感知器究竟做了什么,以及它如何对最初不是线性可分的输入进行分类。
我发现这个页面http://www.borgelt.net/doc/mlpd/mlpd.html说隐藏层可以解释为对输入进行坐标变换。我想阅读更多关于此的内容,但我在网上找不到太多内容,因此如果您能详细说明此内容或向我指出一些涵盖此内容的论文或书籍,我将不胜感激。
我也对这里出现的可视化感到困惑http://tiny.cc/2l7o7y,一个 3 个神经元隐藏层设法分离输入,这是非常有意义的,因为在 3 维空间中分离输入是微不足道的。然而,在这之后添加另外 2 个神经元层会在其中创建明显非线性的形状。我的猜测是它代表了在原始二维空间中创建的分离。是对的吗?如果不是,我们在这里看到了什么,究竟是什么?
