我正在开发用于序列标记的 LSTM。在开发过程中,我对系统进行了各种更改,例如,添加新功能、更改隐藏层中的节点数等。每次更改后,我都会在开发数据集上使用交叉验证来检查准确性。
目前,在每次检查中,我使用 100 次迭代来训练系统,这需要大量时间。所以我想,也许,在开发过程中,我只能使用例如 20 次迭代。然后,每次检查都会更快。找到最佳配置后,我可以切换回 100 次迭代以获得更好的精度。
我的问题是:这种考虑是否正确?更具体地说,如果模型 A 在 20 次训练迭代中优于模型 B,那么 A 在 100 次训练迭代中是否也可能优于 B?
或者,有没有更好的方法来加快开发过程?