我正在尝试使用 keras 顺序层构建提取文本摘要的模型。我很难理解如何输入我的 x 数据。它应该是一个文档数组,每个文档都包含一个句子数组吗?还是我应该进一步将其分解为包含一系列单词的每个句子?
y 输入基本上是对每个句子进行二进制分类,以检查它们是否属于文档的摘要。
第一层是嵌入层,我使用的是 100d Glove 词嵌入。
Ps:我是机器学习的新手。
我正在尝试使用 keras 顺序层构建提取文本摘要的模型。我很难理解如何输入我的 x 数据。它应该是一个文档数组,每个文档都包含一个句子数组吗?还是我应该进一步将其分解为包含一系列单词的每个句子?
y 输入基本上是对每个句子进行二进制分类,以检查它们是否属于文档的摘要。
第一层是嵌入层,我使用的是 100d Glove 词嵌入。
Ps:我是机器学习的新手。
我认为您正在寻找的是具有多对多拓扑的 RNN 网络(LSTM 或 GRU) 。
显然,您的输入是句子(或者更准确地说,是句子的嵌入,因为您无法将原始文本输入网络)。然后对于每个要分配一个值的句子,这意味着对于 n 个输入,您需要 n 个输出。这是多对多架构。
此外,您可能需要检查双向LSTM 以进行学习。与您的问题无关,但值得一提。
有关更多信息,请参阅此