我对 LSTM 模型中的输入向量感到困惑,我使用的数据是文本数据,例如 1,000 个句子。我有两个关于 LSTM 输入层的问题:
1.如果我将这些句子标记为向量(我们可以称之为句子向量),Keras 有没有办法在给定文档的情况下制作句子向量?应该是单词级别的吧?
2.第二个问题是LSTM中的3D Tensor类型。我有 1,000 个句子(样本),如果我想 LSTM 在每个时间步读取一个文档,time_step 将为 1,对吗?最后一个是输入维度,这个输入维度是每个句子中的单词维度(100)或者每个时间步(10)观察到多少个单词?
因此 LSTM 张量应该是 (1000, 1, 10) 或 (1000, 1, 100)