我正在寻找一个 python 包,它可以计算自然文本的一个句子跟随下一个句子的程度。可以简单地计算下一个句子中有多少相同的词,但更好的方法是使用词向量(=语义相似的词而不是精确匹配或同义词)来比较词的相似性。
相干:
Tom loves reading books. He prefers reading books at library. So he always goes to library.
不连贯:
Tom loves reading books. He missed his lunch today. So he always goes to library.
我想这种自动评估(或类似方法)必须有几个写得很好的包,但我就是找不到。有任何想法吗?