我正在使用 gensim 库来查找与我拥有的某些单词最相似的单词。使用 10000 个数据样本(短文本主要是 1-2 个句子)来训练,我得到了非常糟糕的结果!为什么会这样?也通过重复训练和测试得到不同的结果。它不应该是确定性的吗?
model = gensim.models.Word2Vec(senforword2vec)
print(model.most_similar(positive=['bad'], topn=1))
[('金额', 0.9987443089485168)]
在另一列火车和
[('尚未',0.9984885454177856)]