只有 1 个隐藏层的通用逼近定理有证明。
证明是这样的:
使用 2 个神经元创建一个“凹凸”函数。
创建(无限)许多具有不同角度的阶跃函数,以创建塔状形状。
将步长/半径减小到一个非常小的值以近似圆柱体。这是我不相信的
使用这些圆柱体可以近似任何形状。(此时它基本上只是一个像这样的包装问题。
在这段视频中,第 42 分钟,讲师说
在极限内,这将是一个完美的圆柱体。如果气缸足够小。这将是一个完美的圆柱体。对 ?我可以控制半径。
这是幻灯片。
这是另一所大学的pdf版本,因此您不必观看视频。
为什么我不相信?
我创建了一个程序来绘制它,即使我将半径减小了几个数量级,它仍然具有相同的形状。
让我们从一个半径为 0.1 的简单塔开始:
现在让我们将半径减小到 0.01:
现在,您可能会认为它接近圆柱体,但由于缩小效果,它看起来就像是一个完美的圆柱体。
让我们放大:
让我们将半径减小到 0.0000001。
仍然不是一个完美的圆柱体。事实上,气缸的“质量”是一样的。
重现的 Python 代码(需要 NumPy 和 matplotlib):https ://pastebin.com/CMXFXvNj 。
所以我的问题是:
Q1 是否真的可以通过将塔的半径减小到 0 来得到一个完美的圆柱体?
Q2 如果这是真的,为什么我用不同的半径(0.1,vs 1e-7)绘制它时没有区别?
两座塔的形状相同
澄清:我的意思是:相同的形状?假设我们计算一个与我们的塔具有相同半径和高度的实际圆柱体(Vc)的体积,并将其除以塔的体积(Vt)。
Vc = 容积圆柱
Vt = 体积塔
比率(r) = Vc/Vt
该文件/讲座声称这两个卷的比率取决于半径,但在我看来它只是恒定的。
所以他们说的是: lim r -> 0 for ratio(r) = 1 但我的实验表明: lim r -> 0 for ratio(r) = const 并且根本不依赖于半径。
Q3前言
我曾多次收到Dutta和DW的反对意见是,仅仅减少辐射范围并绘制它在数学上并不严谨。
所以让我们假设在 r=0 的限制下它确实是一个完美的圆柱体。
对此的一种可能解释是,限制是一种特殊情况,无法接近它
但如果这是真的,这意味着它没有用处,因为半径不可能完全为零。只有当我们可以通过减小半径逐渐接近完美圆柱体时,它才会有用。
Q3 那么我们为什么还要关心这个呢?
进一步说明
单隐藏层神经网络的原始通用逼近定理证明由 G. Cybenko 完成。然后我认为人们试图对它进行一些视觉解释。我不是在质疑论文!但我质疑链接的lecutre / pdf(由其他人制作)中给出的视觉解释