假设我有一个像下面这样的文本,它通常有 2/3 个句子和 100-200 个字符。
强尼从沃尔玛买了 50 美元的牛奶。现在他只剩下20美元了。
我要提取
人名:乔尼
花费:50美元
剩下的钱:20美元。
消费地点:沃尔玛。
我已经阅读了很多关于循环神经网络的材料。看了RNN上的cs231n视频,了解下一个字符预测。在这些情况下,我们有一组 26 个字符,我们可以将它们用作输出类,以使用概率来查找下一个字符。但是这里的问题似乎完全不同,因为我们不知道输出类。输出取决于文本中的单词和数字,可以是任何随机单词或数字。
我在 Quora 上读到,卷积神经网络也可以提取文本的特征。想知道这是否也可以解决这个特殊问题?