简单来说,如果我的分类是以word2vec为特征的,我该怎么办,如果来了一个新词,哪个没有word2vec?
我正在尝试使用 word2vec 或词向量进行基于实体的分类。
例如:
我必须将句子中的以下单词分类为:
"Google gives information about Nigeria"
在这里,我想将尼日利亚归类为位置。
假设我对每个单词都有很好的 word2vec 向量,根据我了解到的一些读数,循环神经网络可以用于此。因此,word2vec 将使用一种相似的词向量捕获大多数位置。
但我的问题是:
a) 假设那里有一个新位置。比方说,俄罗斯。那么,我需要为这个位置分配一个新的词向量吗?
b) 如果我的训练输入没有语法意义。例如,
“谷歌信息尼日利亚”。尼日利亚的其他一切都与非位置标签相关联。这种情况是否适用于在非语法句子中找到新位置。