在超参数搜索期间要运行多少个 epoch?

数据挖掘 训练 超参数 超参数调整
2021-09-20 19:51:21

如果我正在进行超参数搜索并比较两个不同的超参数(但不是时期数),是否有一些既定的经验法则来运行多少个时期?如果我只是在几个 epoch 之后进行比较,那会让我很好地了解它如何完全收敛(例如在 1000 epochs 之后)。是否有任何研究论文有人研究过这个问题?

1个回答

一般的经验法则是运行 epoch 的数量,直到验证错误开始增加。

有时快速的初始学习不会导致以后的最佳表现。