生成相似词的最佳方法是什么?

数据挖掘 语义相似性
2022-02-15 03:20:23

大家好,我对所有 NLP 任务(nlpprogress.com、paperwithcode.com)和很棒的工具(nltk、flair、huggingface 等)都非常了解。我想取一个词,并预测一个相似的词,有点像旧的“Google Sets”功能,除了从一个例子中推断出来。我认为 GPT-3 可能是一些种子文本的最佳选择,例如

here is a list of similar things: banana, 

并要求它预测下一个单词。

transformer.huggingface.co 很有希望(尽管它本身就很不合适),我认为 GPT-3 确实很可能是答案。

但另一种选择是通过“类型”关系导航树库……更快、更便宜。

我已经标记了这个“语义相似性”,但我真的不希望这种关系是“相似的”,而是“是同一组的一部分”。

最欣赏这个领域的实际从业者的想法,而不是像我这样的业余爱好者:)

1个回答

但另一种选择是通过“类型”关系导航树库……更快、更便宜。

WordNet正好提供了这一点:它是一个词汇数据库,其中单词按同义词分组,组之间有几种类型的关系,特别是上位词/下位词(更一般/更具体)。

该数据库可以下载,并且有一个库可以通过 nltk 使用它