以下是我对文本预测案例中使用的 N gram 模型的理解:
给定一个句子,说“我爱我的”(比如 N = 1 /bigram),使用 N gram 并说 4 个可能的候选者(国家、家庭、妻子、学校),我可以估计每个候选者的条件概率并取一个概率最高的词作为下一个词。
问题 :
我理解模型的概率部分,但为了得到概率,我们需要可能的候选人(接下来的词,在这种情况下是家庭、妻子、学校、国家)。模型如何选择候选人
大多数在线文章都讨论了概率部分,但没有提到任何关于训练阶段的内容。这个模型的训练阶段到底发生了什么?