如何使用 genism 用新的训练数据更新预训练的 word2vec 模型

数据挖掘 Python 深度学习 word2vec gensim
2022-02-26 13:44:15

嗨,我已经使用 genism 使用以下代码加载了西班牙语 fasttext word2vec 模型:

Word2Vec = KeyedVectors.load_word2vec_format('../data/raw/wiki.es.vec',
                                             binary=False)

现在我想用新的训练句子训练 word2vec。

我知道在 genism 中,如果加载了模型,可以使用以下代码来训练新句子:

 model.build_vocab(sentences)  # prepare the model vocabulary
 model.train(sentences, )

KeyedVectors.load_word2vec但是,如果我使用加载模型,如何更新模型。

谢谢!

1个回答

根据Gensim 文档,您不能使用键控向量来恢复训练您需要在之前的训练运行中保存完整模型以允许恢复训练。Keyedvectors 删除训练相关信息和其他元数据以减少内存占用。