哪篇论文介绍了“softmax”这个术语?

人工智能 神经网络 深度学习 分类 历史 软最大
2021-11-14 16:36:45

如今,softmax 函数广泛用于深度学习,特别是神经网络分类。然而,这个术语和功能的起源几乎从未在任何地方提及。那么,哪篇论文介绍了这个术语?

1个回答

似乎引入了“softmax”一词的论文是 John S. Bridle 的Training Stochastic Model Recognition Algorithms as Networks can Lead to Maximum Mutual Information Estimation of Parameters (1989, NIPS)。

附带说明一下,softmax 函数(带基b=eβ)

σ(z)i=eβzij=1Keβzj for i=1,,K and z=(z1,,zK)RK

与玻尔兹曼(或吉布斯)分布非常相似

pi=eεi/kTj=1Meεj/kT

它是由 Ludwig Boltzmann 在 1868 年提出的,所以 softmax 函数的思想和表述相当古老。