2vec 和 doc2vec 的区别

数据挖掘 机器学习 深度学习 信息检索
2021-09-16 01:58:33

paragraph2vec相同的Doc2vec还是每种方法都不同?

1个回答

可能有不同的实现,但这两个术语指的是同一件事。

两者都将通用文本块转换为向量,类似于 word2vec 将单词转换为向量的方式。段落向量不需要引用段落,因为它们传统上以文本形式排列。它们理论上可以应用于短语、句子、段落,甚至更大的文本块。

这是段落向量的一个定义:

一种无监督算法,从可变长度的文本片段(例如句子、段落和文档)中学习固定长度的特征表示。

如果您有兴趣,请阅读全文:

https://cs.stanford.edu/~quocle/paragraph_vector.pdf