我想知道是否可以使用强化学习(因为它会随着 Google DeepMind 和 AlphaGo 的东西越来越流行)来解析和提取文本中的信息。
例如,它是否可以成为结构化预测的竞争方法,例如
Named Entity Recognition (NER),即用“city”标注纽约的任务,用“organization”标注New York Times 词性标注(POS),即将词分类为行列式、名词等信息提取,即在文本中查找和标记一些目标信息,例如 12/03 是给定上下文含义 12 月 3 日的日期,并且具有标签“到期日期” 执行这些任务的相关建模是什么?
我会天真地想到一个指针,它从头到尾读取文本并用标签注释每个“字母”。也许它会知道“单词”中的相邻字母共享相同的标签,等等。它能够通过这种方法学习长期依赖关系吗?
我对与此主题相关的任何想法或参考资料感兴趣。