为什么神经网络中不经常使用高斯激活函数?

机器算法验证 神经网络 正态分布
2022-03-31 04:56:28

高斯函数直接模拟概率,但它们的使用比逻辑激活函数少得多。有谁知道为什么不使用高斯?

1个回答

@Glen_b 在评论中指出,计算精确的 Normal CDF 概率很昂贵。存在准确的近似值,但仍然必须问为什么要这样做?

Logit 和 probit 函数看起来基本相同,直到重新缩放。

在此处输入图像描述

(图片转载自@gung 的回答here。)

从实际的角度来看,很难看出两者之间的微小差异会有多大意义。此外,最近关于 ReLU(和类似)激活函数的工作已经发现对逻辑单元的实质性改进。由于逻辑单元和概率单元的相似性,我们可以推测 ReLU 的性能也将优于概率单元。

总之,概率单位是比 ReLU(或其变体)获得更差结果的更昂贵的方法。