我一直在熟悉Word2Vec和Doc2Vec。在阅读了包括T Mikolov(Doc2Vec 的创建者)在内的多篇论文后,我不清楚 Doc2Vec 的神经网络是什么样子的。
我得到 Word2Vec:一个具有 3 层(1 个隐藏层)的神经网络。输入层包含词汇中的所有单词。隐藏层的大小与嵌入的大小相同,而输出层的大小与 vocab 的大小相同。这当然是 CBOW 框架。
Doc2Vec 如何改变事物?
我一直在熟悉Word2Vec和Doc2Vec。在阅读了包括T Mikolov(Doc2Vec 的创建者)在内的多篇论文后,我不清楚 Doc2Vec 的神经网络是什么样子的。
我得到 Word2Vec:一个具有 3 层(1 个隐藏层)的神经网络。输入层包含词汇中的所有单词。隐藏层的大小与嵌入的大小相同,而输出层的大小与 vocab 的大小相同。这当然是 CBOW 框架。
Doc2Vec 如何改变事物?
没有什么只是开始随机初始化的段落向量与随机初始化的词向量连接/平均。其他一切几乎都一样。