如何选择 GRU 的隐藏状态的大小?

人工智能 机器学习 循环神经网络 超参数优化 隐藏层 门控循环单元
2021-11-09 08:16:32

我试图了解隐藏状态的大小如何影响 GRU。

例如,假设我想做一个 GRU 计数。我会用三个数字喂它,我希望它预测第四个。

我应该如何选择 GRU 的隐藏状态的大小?

1个回答

是的,你对隐藏状态的理解是正确的。但是隐藏状态的大小是一个需要通过反复试验找到的超参数。没有封闭形式的公式或解决方案将隐藏状态的大小与手头的问题联系起来。但是,有一些经验法则,例如从隐藏状态的大小开始为 2 的幂等。继续调整超参数,直到获得非常好的预测。