关于激活函数工作机制的困惑

数据挖掘 神经网络 分类 支持向量机 激活函数 自习
2022-03-08 10:11:41

对于二进制分类,无论使用何种模型,sigmoid 函数都是输出层的不错选择,因为实际输出值“Y”为 0 或 1,因此预测输出值为 0 到 1 之间的数字是有意义的。

我的困惑是输出层中是否存在二进制阶跃函数,它将权重和输入的线性组合的值压缩为 0 或 1?分类是否意味着总是在隐藏层中的线性或非线性函数之上应用阈值函数?

假设预测输出值为 0.75,实际 Y 为 0。那么,0.75 是如何转换为 1 的呢?损失函数会将误差计算为实际 - 预测 = 0-0.75 = -0.75

有人可以解释一下数学或指出一些显示工作步骤的链接吗?谢谢你。

1个回答

我认为Rubens Zimbres的下图可以表达这个过程除了损失函数部分之外是如何完成的: 图像

输出层中是否存在二进制阶跃函数,它将权重和输入的线性组合的值压缩为 0 或 1?

答:是的,如果您考虑以下示例显示 Sigmoid 如何将值压缩到 0 和 1 之间: 图像

分类是否意味着总是在隐藏层中的线性或非线性函数之上应用阈值函数?

答:确实如此。

假设预测输出值为 0.75,实际 Y 为 0。那么,0.75 是如何转换为 1 的呢?损失函数会将误差计算为实际 - 预测 = 0-0.75 = -0.75

答:基于分类的 NN 的损失函数和误差计算不仅仅是通过计算 YActualYprediction

但它通常通过Softmax 激活函数交叉熵的组合使用,如下所示: 图像

查看整个训练过程 Multinomial Logistic ClassificationD(S(wx+b),L) 图像