从分析上讲,sigmoid 的对数始终是定义的和有限的,因为 sigmoid 返回的值限制在开区间 (0, 1),而不是使用有效概率 [0, 1] 的整个闭区间。在软件实现中,为了避免数值问题,最好将负对数似然写为 z 的函数,而不是 ˆy = σ(z) 的函数。如果 sigmoid 函数下溢为零,则取 y 的对数会产生负无穷大。
问题:
- Sigmoid函数的范围是闭区间[0,1]?https://upload.wikimedia.org/wikipedia/commons/thumb/8/88/Logistic-curve.svg/1200px-Logistic-curve.svg.png为什么提到开放?
- z 而不是 y 的写函数如何影响它不达到 0?那些表格是什么?