我正在扩展我对 Keras 包的知识,并且我一直在使用一些可用的模型进行工具化。我有一个 NLP 二进制分类问题,我正在尝试解决并且一直在应用不同的模型。
在处理了一些结果并阅读了越来越多关于 LSTM 的内容之后,这种方法似乎远远优于我尝试过的任何其他方法(跨多个数据集)。我一直在想,“为什么/什么时候不使用 LSTM?”。在拥有一些遭受梯度消失的模型之后,使用 LSTM 固有的附加门对我来说非常有意义。
那么 LSTM 有什么问题呢?他们哪里做得不好?我知道没有“一刀切”的算法,所以 LSTM 肯定有缺点。