帮助我了解如何构建词向量表示

数据挖掘 word2vec 无监督学习
2022-02-24 08:43:06

假设我有一个很大的单词列表。我想把这个列表变成一个维度的向量空间N这样每个词都是这个向量空间中的一个向量。但我不知道该怎么做。一些问题:

  1. 清单够吗?对于列表的每个元素,我需要x例句也是?
  2. 计算机如何从列表/语料库中推导出向量空间的维度?
  3. 有没有办法确定向量空间的维度是否与英文对应?
1个回答

我假设您的意思是单词的向量表示,不要被在表示向量空间中的文档的词袋方法中产生的向量表示混淆。Word2vec 是一种方法,您可以在其中训练模型以将单词表示为提供的上下文的函数。

下面的答案是:

  • 1)否:您需要一些使用该词的上下文表示。例如:Skip-gram。
  • 2)否:这是用户定义的参数
  • 3) <我不明白这个问题>