doc2vec 的替代品?

数据挖掘 Python nlp 数据 词嵌入 数据科学模型
2022-02-22 00:44:35

doc2vec 嵌入模型有哪些替代方案?即将段落/文档转换为向量的模型,而不仅仅是获取文档中每个单词的单词嵌入的平均值/总和的模型。

1个回答

取决于您的目标任务。如果您要对文档进行分类,那么例如 fastText 有它自己的方法,还有其他分类技术,不是严格生成嵌入,如 LSA / LDA(使用主题建模)或词移动距离。