我想创建一个神经网络,可以从 pdf 文档中获取一些特定的单词到 JSON 或 XML 中。例如,假设我有一个包含有关国家/地区的一些信息的 pdf,并且我想恢复国家/地区的名称和人口以获得如下信息:
<countries>
<country>
<name>
France
</name
<population>
70m
</population
</country>
.
.
.
</countries>
我应该建立一个神经网络并自己训练吗?如果是这样,您能否提供一个很好的教程,或者是否有一个我可以使用的已经训练过的教程?