在开始一个新的机器学习项目之前,估计运行 1、10、100、1k 个 epoch 需要多长时间是非常有用的。粗略的估计是绰绰有余的(即 1 个 epoch 需要 1 秒、10 秒、1 分钟、1 小时等)。
鉴于以下变量,您能否推荐任何可以提供估计的启发式方法?
- 问题类型(例如图像分割)
- 模型类型(例如 PyTorch Unet)
- 数据集(例如 10k 图像,512x512)
- 计算(例如 AWS p2.xlarge)
- 库(例如 PyTorch)
经验方法(例如,在较小的数据子集上进行训练并相应地扩展)是解决这个问题的更好方法吗?