最近我正在阅读一篇基于新评估指标 SIMILE 的论文。在一节中,对 SIMILE 和 BLEU 进行了验证损失比较。该图显示了使用 BLEU 和 SIMILE 进行训练时的预期 BLEU 成本。
我无法理解的是使用 BLEU 和 SIMILE 进行培训时预期的 BLEU 成本是什么意思?是否为这些分数定义了任何单独的成本函数?
我附上了图表的图像。
最近我正在阅读一篇基于新评估指标 SIMILE 的论文。在一节中,对 SIMILE 和 BLEU 进行了验证损失比较。该图显示了使用 BLEU 和 SIMILE 进行训练时的预期 BLEU 成本。
我无法理解的是使用 BLEU 和 SIMILE 进行培训时预期的 BLEU 成本是什么意思?是否为这些分数定义了任何单独的成本函数?
我附上了图表的图像。
看起来他们用于训练的方法需要一组候选假设,以及相关的概率,然后最小化该分布上成本函数的期望值。第 3 节的损失函数被最小化:
.
使用的成本函数之一是, 在哪里是目标并且是生成的假设。我不确定在哪里来自,但是因为 BLEU 成本函数可能是他们提到预期 BLEU 时所指的。