在这本在线书籍中查看这个短语: https ://hyp.is/GsHrloyvEeaYQ093X053Wg/neuralnetworksanddeeplearning.com/chap2.html
它指的是二次成本函数 (RSS) 可以写为每个单独训练示例的平均值。
因此,如果单个训练示例的成本是 Cx = (1/2) * ||ya||^2
你可以有 C = (1/n) * Σ(Cx)
你能举一个不能写成平均值的错误/成本函数的例子吗?
在这本在线书籍中查看这个短语: https ://hyp.is/GsHrloyvEeaYQ093X053Wg/neuralnetworksanddeeplearning.com/chap2.html
它指的是二次成本函数 (RSS) 可以写为每个单独训练示例的平均值。
因此,如果单个训练示例的成本是 Cx = (1/2) * ||ya||^2
你可以有 C = (1/n) * Σ(Cx)
你能举一个不能写成平均值的错误/成本函数的例子吗?
一个例子是 KL 散度,它量化了实际密度和预测密度之间的差异: