我们是如何得出用于计算概率的 sigmoid 函数的?
为什么不使用一些其他函数来“压缩”位于 [0, 1] 之间的值。甚至可能只是将这些值标准化,以便它们加起来等于一。
我们是如何得出用于计算概率的 sigmoid 函数的?
为什么不使用一些其他函数来“压缩”位于 [0, 1] 之间的值。甚至可能只是将这些值标准化,以便它们加起来等于一。
我认为对 sigmoid 函数受欢迎程度的一个很好的解释是在这些讲义中(http://www.stat.cmu.edu/~cshalizi/uADA/12/lectures/ch12.pdf)