CBOW 模型实际上将多个词作为输入,将目标中心词作为输出。
因此,经过训练的模型实际上将几个词映射到一个词,我的意思是它需要上下文词并输出中心词。但是我们期望得到的是模型将一个词映射到它的向量表示。似乎输出是重合的,但不是输入和映射。
所以就像在基因论中一样,将一个单词映射到它的向量表示是如何真正起作用的?它只是将所有最终模型的输出保存为中心词的向量表示吗?但最终模型的输出将接近基本事实的 one-hot embedding,而不是带有上下文信息的向量。
简而言之,我的问题是:
CBoW 模型如何将一个词转换为其向量表示?
