我正在玩卷积神经网络,使用 Keras+Tensorflow 对分类数据进行分类。我有两个损失函数可供选择:categorial_crossentropy
和sparse_categorial_crossentropy
。
我对categorial_crossentropy
损失函数有一个很好的直觉,它的定义如下:
在哪里,
- 指的是模型参数,例如神经网络的权重
- 是真正的标签
- 是预测的标签
两个标签都使用 one-hot 编码方案。
问题:
- 上述损失函数如何变化
sparse_categorial_crossentropy
? - 它背后的数学直觉是什么?
- 什么时候使用一个而不是另一个?