正如标题所示,我在这里发帖是希望有人可以指导我使用 NLP 模型来标记单词。
更具体地说,这就是我想做的事情。我想使用可以标记/分类单词的 NLP 模型构建一个抽认卡应用程序。所以让我们想象一下,我有一个 CSV 文件,其中包含一个问题(英文)和一个答案(法文):
+----------------------------
| plane | avion |
+-------------+-------------+
| chopsticks | baguettes |
+-------------+-------------+
| airport | aéroport |
+-------------+-------------+
这个想法是学习者会选择一个上下文甲板(在这个例子中,一个与飞机旅行相关的甲板)。该套牌将由机器学习算法制作的标签“机场”生成。
因此,我应该寻找任何好的模型吗?
编辑:
经过大量研究,我遇到了 NLU,它满足了我上面描述的许多要求。如果您有兴趣,请查看这些链接:什么是 NLP 技术来概括文本中手动创建的规则?和NLP 算法,用于对具有特定主题的单词列表进行分类,以及这个 repo:Probase-Concept