我已经在 NLTK 中使用 Python 工作了一段时间。我面临的问题是,他们无法使用我的自定义数据在 NLTK 中训练 NER。他们使用 MaxEnt 并在 ACE 语料库上对其进行了训练。我在网上搜索了很多,但找不到任何可以用来训练 NLTK NER 的方法。
如果有人可以向我提供任何链接/文章/博客等,这些链接/文章/博客等可以指导我使用用于训练 NLTK NER 的训练数据集格式,以便我可以准备我的特定格式的数据集。如果我被定向到任何可以帮助我训练 NLTK 的 NER 以获取我自己的数据的链接/文章/博客等。
这是一个被广泛搜索且回答最少的问题。可能对将来与 NER 合作的人有所帮助。