如果有人能回答这些问题,那就太好了。我正在进行 LSTM 的最后一年项目。
目前,我对 LSTM 代码感到困惑和困惑。我可以使用 4 个超参数:
- 回望
- 批量大小
- LSTM 单元
- 纪元数
如果我调整每个超参数,你能解释一下我的结果会发生什么吗?如果我们每次运行代码都得到不同的结果,这也很常见吗?
如果有人能回答这些问题,那就太好了。我正在进行 LSTM 的最后一年项目。
目前,我对 LSTM 代码感到困惑和困惑。我可以使用 4 个超参数:
如果我调整每个超参数,你能解释一下我的结果会发生什么吗?如果我们每次运行代码都得到不同的结果,这也很常见吗?
回顾一下,我不知道回顾是一个超参数,但是在 LSTM 中,当您尝试预测下一步时,您需要通过“回顾”某些时间步骤来安排数据,以准备训练数据集,例如,假设您想估计每次 t 发生的情节的下一个值。您需要将数据重新排列成如下形状: {t1, t2, t3} -> t4 {t2, t3, t4] -> t5 {t3, t4, t5} -> t6 网络将学习这一点并将能够根据先前的时间步长预测 tx。
批量大小(仅指 LSTM),大致是每一步将训练多少样本,批量大小越大,训练速度越快,但需要更多内存。在 GPU 中最好有更大的批量大小,因为将值从 GPU 复制到内存很慢。
LSTM 单元,指的是你将拥有多少“智能”神经元。这高度依赖于您的数据集,通常您根据矢量尺寸确定这一点。
No. of Epochs,算法将运行多少次来近似观察结果。通常,很多时期会过度拟合您的模型,而很少会出现拟合不足的模型。
clip
控制梯度消失/爆炸的超参数。