在一次讨论中,有朋友提到下面的函数不能优化,所以不能用在学习算法中。
为什么这个函数不能用作损失函数?
上下文
这是关于机器学习和最小化大小为上的错误。我说的是将算法预测与现实世界记录的实际结果进行比较。使用成本函数将预测与其实际值进行比较。
是“真实”映射,是我的“模型”。
应该近似于。
请有人解释一下为什么它也不能区分吗?
在一次讨论中,有朋友提到下面的函数不能优化,所以不能用在学习算法中。
为什么这个函数不能用作损失函数?
上下文
这是关于机器学习和最小化大小为上的错误。我说的是将算法预测与现实世界记录的实际结果进行比较。使用成本函数将预测与其实际值进行比较。
是“真实”映射,是我的“模型”。
应该近似于。
请有人解释一下为什么它也不能区分吗?
损失函数必须是可微的才能执行梯度下降。似乎您正在尝试测量某种 1 精度(例如,错误标记样本的比例)。这没有导数,所以你不能使用它。相反,使用交叉熵。