使用 BLEU 和 SIMILE 进行训练时,预期的 BLEU 成本是什么意思?

人工智能 自然语言处理 训练 公制 期待
2021-11-14 00:29:35

最近我正在阅读一篇基于新评估指标 SIMILE 的论文。在一节中,对 SIMILE 和 BLEU 进行了验证损失比较。该图显示了使用 BLEU 和 SIMILE 进行训练时的预期 BLEU 成本。

我无法理解的是使用 BLEU 和 SIMILE 进行培训时预期的 BLEU 成本是什么意思?是否为这些分数定义了任何单独的成本函数?

我附上了图表的图像。

在此处输入图像描述

1个回答

看起来他们用于训练的方法需要一组候选假设U(x),以及相关的概率,然后最小化该分布上成本函数的期望值。第 3 节的损失函数被最小化:

LRisk=uU(x)cost(t,u)p(u|x)uU(x)p(u|x).

使用的成本函数之一是1BLEU(t,h), 在哪里t是目标并且h是生成的假设。我不确定在哪里p(u|x)来自,但是1LRisk因为 BLEU 成本函数可能是他们提到预期 BLEU 时所指的。