人工智能 - 文本摘要的输入维度应该是多少？ - 吾爱随笔录

人工智能神经网络机器学习词嵌入文本摘要

2021-10-22 22:04:05

我正在尝试使用 keras 顺序层构建提取文本摘要的模型。我很难理解如何输入我的 x 数据。它应该是一个文档数组，每个文档都包含一个句子数组吗？还是我应该进一步将其分解为包含一系列单词的每个句子？

y 输入基本上是对每个句子进行二进制分类，以检查它们是否属于文档的摘要。

第一层是嵌入层，我使用的是 100d Glove 词嵌入。

Ps：我是机器学习的新手。

1个回答

我认为您正在寻找的是具有多对多拓扑的 RNN 网络（LSTM 或 GRU）。

显然，您的输入是句子（或者更准确地说，是句子的嵌入，因为您无法将原始文本输入网络）。然后对于每个要分配一个值的句子，这意味着对于 n 个输入，您需要 n 个输出。这是多对多架构。

此外，您可能需要检查双向LSTM 以进行学习。与您的问题无关，但值得一提。

有关更多信息，请参阅此

其它你可能感兴趣的问题