数据挖掘 - Keras 中的 LSTM 输入 - 吾爱随笔录

我对 LSTM 模型中的输入向量感到困惑，我使用的数据是文本数据，例如 1,000 个句子。我有两个关于 LSTM 输入层的问题：

1.如果我将这些句子标记为向量（我们可以称之为句子向量），Keras 有没有办法在给定文档的情况下制作句子向量？应该是单词级别的吧？

2.第二个问题是LSTM中的3D Tensor类型。我有 1,000 个句子（样本），如果我想 LSTM 在每个时间步读取一个文档，time_step 将为 1，对吗？最后一个是输入维度，这个输入维度是每个句子中的单词维度（100）或者每个时间步（10）观察到多少个单词？

因此 LSTM 张量应该是 (1000, 1, 10) 或 (1000, 1, 100)