男孩举起球棒击球。
在上面的句子中,名词“蝙蝠”是指木棍。它并不意味着蝙蝠,飞行的哺乳动物,它也是一个名词。使用 NLP 库来查找定义的名词版本仍然是模棱两可的。
如何编写一种算法来获得确切的定义,给定一个单词,以及它所使用的句子?
我在想你可以使用 word2vec,然后使用 autoextend https://arxiv.org/pdf/1507.01127.pdf来区分 2 个不同的词位,例如 bat(动物)和 bat(木棍)。
那么字典定义和句子中任何单词之间最接近的余弦距离可能表示正确的定义。
这听起来正确吗?