我有一个包含单词的文件。我必须计算每个单词与其他单词的余弦相似度。为此,我在 gensim 中使用了以下公式:
- model.most_similar([字])
- model.save('text.txt')
我想保存每个单词与其他单词的余弦相似度的结果,以便我可以在分类和聚类中进一步使用它们。但不知道如何检索使用 gensim 模型保存的结果?
我有一个包含单词的文件。我必须计算每个单词与其他单词的余弦相似度。为此,我在 gensim 中使用了以下公式:
我想保存每个单词与其他单词的余弦相似度的结果,以便我可以在分类和聚类中进一步使用它们。但不知道如何检索使用 gensim 模型保存的结果?
这个问题不是很清楚。
如果问题是如何保存和检索每个单词与其他单词的余弦相似度,那么您可以将它们保存在数组中并使用pickle再次保存和加载它们。
或者,如果问题是如何检索gensim model
,那么函数是gensim.models.word2vec.Word2Vec.load()