nlp 中的插值 - O 项的定义
数据挖掘
nlp
插值
2022-02-20 07:09:41
2个回答
术语点:那些符号不是O,而是 thetas Θ。
令人困惑的是,这些标记为 theta 的值通常称为 lambdas,如您引用的页面中所示。它们是用于插值(与退避相反)的权重,总和为 1,可以通过多种方法从语料库本身计算:
这些 λ 值是如何设置的?简单插值和条件插值 λs 都是从保留的语料库中学习的。保留语料库是一个额外的训练语料库,我们通过选择使保留语料库的可能性最大化的 λ 值来设置像这些 λ 值这样的超参数。也就是说,我们固定 N-gram 概率,然后搜索插入方程式时的 λ 值。4.24给出了保留集的最高概率。有多种方法可以找到这个最优的 λs 集。一种方法是使用第 7 章中定义的 EM 算法,这是一种迭代学习算法,收敛于局部最优 λs (Jelinek and Mercer, 1980)。
- 语音和语言处理。第 4 章:N-Gram(4.4.3 退避和插值)(第 15 页)
您会将 thetas 视为概率。因此它们必须大于 0,并且它们的总和必须为 1。从技术上讲,您可以手动设置它们,但您可以使用多种方法找到 theta 的最佳值。
其它你可能感兴趣的问题