我一直在研究一个基于 NN 的分类系统,它接受文档向量作为输入。我真的不能谈论我专门训练神经网络的内容,所以我希望得到一个更一般的答案。
到目前为止,我一直在使用的词向量(特别是 R 的 text2vec 包中的 gloVe 函数)一直是目标向量。到目前为止,我还不知道 word2vec 训练产生了上下文向量,坦率地说,我不确定它们到底代表什么。(这不是主要问题的一部分,但如果有人可以向我指出有关上下文向量的用途和作用的资源,那将不胜感激)
我的问题是,这些上下文词向量在任何类型的分类方案中都有多大用处?我是否错过了输入神经网络的有用信息?
从质量上讲,这四种方案的效果如何?
- 仅目标词向量。
- 仅上下文词向量。
- 平均目标和上下文向量。
- 连接向量(即 100 个向量 word2vec 模型的长度为 200)