不确定这是否是正确的堆栈站点,但这里有。
.similiarity 方法是如何工作的?
哇 spaCy 很棒!它的 tfidf 模型可能更简单,但 w2v 只需要一行代码?!
在他 关于 spaCy 的10 行教程中,andrazhribernik向我们展示了可以在令牌、发送、单词块和文档上运行的 .similarity 方法。
之后nlp = spacy.load('en')
,doc = nlp(raw_text)
我们可以在令牌和块之间进行 .similarity 查询。.similarity
但是,这种方法在幕后计算的是什么?
SpaCy 已经有了非常简单的.vector
,它计算从 GloVe 模型训练的 w2v 向量(一个.tfidf
或.fasttext
方法有多酷?)。
该模型是简单地计算这两个 w2v、.vector、向量之间的余弦相似度还是比较其他一些矩阵?文档中的细节不清楚;任何帮助表示赞赏!