机构名称的生成

数据挖掘 命名实体识别 文本生成
2022-03-11 05:10:43

我找到了许多用于从文本中自动提取机构名称的解析器(例如这个)。从某种意义上说,我的任务是相反的:我想自动生成类似于现实的机构名称,并有可能按类型(私人、公共、教育等)和分支机构来区分它们。

是否有任何算法/应用程序/论文可以找到?或者,是否有任何(免费访问)包含此类数据的数据库?

2个回答

条件是你有数据,是的,你可以。查看 Generative Adversarial Networks 和/或 Reinforcement Learning 以生成文本。本文是一个很好的起点:https ://openreview.net/forum?id=rJedV3R5tm 。

另外,这里有一个工具可以帮助你。你可以做的是不按类型区分,生成这些机构名称,然后建立另一个模型对它们进行分类。

如果您想构建自己的数据集,可以查看以下软件包:

它们都提供了基于特定语言环境生成公司/机构名称的功能。

如果您的目标是为 NER 任务生成训练数据,那么这应该是一个好的开始。如果是生成公司名称,这已经涵盖了相当多的内容。