我最近开发了一个 DNN 模型,我想知道训练时间到底是多少,其中包含哪些步骤?例如,我执行了以下步骤 1)通过 5 倍 CV 确定最佳网络架构(使用反向传播) 2)一旦我获得最佳架构,我使用无监督学习使用未标记的数据获得初始权重 3)我应用反向传播使用步骤 2 给出的初始权重微调网络(运行了 500 个时期)
这个过程的训练时间是多少?它包括所有步骤还是仅包括步骤 2 或 3?或者一般来说,训练时间是否包括运行代码以获得最佳架构的时间,或者它还包括确定最佳网络架构所花费的时间?
我最近开发了一个 DNN 模型,我想知道训练时间到底是多少,其中包含哪些步骤?例如,我执行了以下步骤 1)通过 5 倍 CV 确定最佳网络架构(使用反向传播) 2)一旦我获得最佳架构,我使用无监督学习使用未标记的数据获得初始权重 3)我应用反向传播使用步骤 2 给出的初始权重微调网络(运行了 500 个时期)
这个过程的训练时间是多少?它包括所有步骤还是仅包括步骤 2 或 3?或者一般来说,训练时间是否包括运行代码以获得最佳架构的时间,或者它还包括确定最佳网络架构所花费的时间?
通常,最有用的度量是运行整个训练脚本所需的总“墙”时间。
如果训练被定义为包括超参数搜索,那么应该包括超参数。结果是最长的经验时间,这对于估计重现类似结果所需的时间很有用。