我已经使用 GenSim 4 训练了一个 word2vec 模型。
问题是我的语料库很小。
如何测试我获得的词嵌入的质量?
是否有一些标准措施可以做到这一点?
测试嵌入的一种方法是查看您的模型与其他嵌入如何完成单词类比的共识一致的频率。已建立的词嵌入类比集合在这里。