背景:在 T. Mikolov 等人的论文“向量空间中单词表示的有效估计”中,作者使用了短语:“单词之间的线性规律”。
在论文的上下文中,或者在与 NLP 相关的一般上下文中,这意味着什么?
引用论文中的段落:
有点令人惊讶的是,人们发现单词表示的相似性超出了简单的句法规则。使用对词向量执行简单代数运算的词偏移技术,例如,向量(“King”)-向量(“Man”)+向量(“Woman”)导致向量最接近单词 Queen [20] 的向量表示。
在本文中,我们尝试通过开发新的模型架构来最大限度地提高这些向量运算的准确性,以保持单词之间的线性规律。我们设计了一个新的综合测试集来测量句法和语义规则1,并表明可以以高精度学习许多这样的规则。此外,我们讨论了训练时间和准确性如何取决于词向量的维度和训练数据的数量。