在机器学习文献中,说某物“嵌入”在某个空间中是什么意思?

人工智能 机器学习 术语 定义 嵌入
2021-11-09 10:08:26

在机器学习文献中,我经常看到它说某些东西“嵌入”在某个空间中。例如,某些东西“嵌入”在特征空间中,或者我们的数据“嵌入”在点积空间中,等等。但是,我从未真正看到过关于这应该是什么意思的解释。那么,说某物“嵌入”在某个空间中究竟意味着什么?

1个回答

嵌入是在新(或目标)域中表示数据(来自源域)的过程。通常,源域是离散的,目标域是连续的。例如,可以通过 word2vec 方法将单词嵌入到连续向量空间中。

使用嵌入的主要原因是在目标域中进行有意义的数学计算,这在源域中是不可能或直接的。例如,将"brother" - "man" + "woman"单词和字符级别中没有意义的两个单词相加。然而,当使用 word2vec 时,embedding("brother") - embedding("man") + embedding("woman")它可以是有意义的,并且可以与其他嵌入向量进行比较;它应该在“姐妹”的嵌入向量附近。