人工智能 - 使用 BLEU 和 SIMILE 进行训练时，预期的 BLEU 成本是什么意思？ - 吾爱随笔录

人工智能自然语言处理训练公制期待

2021-11-14 00:29:35

最近我正在阅读一篇基于新评估指标 SIMILE 的论文。在一节中，对 SIMILE 和 BLEU 进行了验证损失比较。该图显示了使用 BLEU 和 SIMILE 进行训练时的预期 BLEU 成本。

我无法理解的是使用 BLEU 和 SIMILE 进行培训时预期的 BLEU 成本是什么意思？是否为这些分数定义了任何单独的成本函数？

我附上了图表的图像。

1个回答

看起来他们用于训练的方法需要一组候选假设 $\mathcal{U}(x)$ ，以及相关的概率，然后最小化该分布上成本函数的期望值。第 3 节的损失函数被最小化：

$\mathcal{L}_{Risk} = \sum\limits_{u \in \mathcal{U}(x)} cost(t, u) \frac{p(u|x)}{\sum_{u' \in \mathcal{U}(x)} p(u'|x)}$ .

使用的成本函数之一是 $1 - \texttt{BLEU}(t, h)$ ，在哪里 $t$ 是目标并且 $h$ 是生成的假设。我不确定在哪里 $p(u|x)$ 来自，但是 $1 - \mathcal{L}_{Risk}$ 因为 BLEU 成本函数可能是他们提到预期 BLEU 时所指的。

其它你可能感兴趣的问题