用强化学习提取信息,可行吗?

数据挖掘 文本挖掘 强化学习 解析 命名实体识别
2021-10-14 10:23:39

我想知道是否可以使用强化学习(因为它会随着 Google DeepMind 和 AlphaGo 的东西越来越流行)来解析和提取文本中的信息。

例如,它是否可以成为结构化预测的竞争方法,例如

Named Entity Recognition (NER),即用“city”标注纽约的任务,用“organization”标注New York Times 词性标注(POS),即将词分类为行列式、名词等信息提取,即在文本中查找和标记一些目标信息,例如 12/03 是给定上下文含义 12 月 3 日的日期,并且具有标签“到期日期” 执行这些任务的相关建模是什么?

我会天真地想到一个指针,它从头到尾读取文本并用标签注释每个“字母”。也许它会知道“单词”中的相邻字母共享相同的标签,等等。它能够通过这种方法学习长期依赖关系吗?

我对与此主题相关的任何想法或参考资料感兴趣。

2个回答

理想情况下,您希望在环境中存在延迟反馈和随机转换的情况下使用强化学习。尽管您可能会应用 RL,但在您的情况下,使用序列到序列学习框架可能会更好(https://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural- networks.pdf),因为您可以访问整个句子并且不涉及随机性。

关于 RL 与信息提取的主题,这可能会引起人们的兴趣:通过强化学习获取外部证据来改进信息提取 ( http://arxiv.org/abs/1603.07954 )

查看这篇文章:https ://paperswithcode.com/paper/a-new-concept-of-deep-reinforcement-learning-1 ,名称为“基于深度强化学习的增强通用标记系统的新概念”