假设我们有一个 GRU 网络,其中包含层来处理训练数据集元组,特征,以及每一层的节点。
我对如何计算算法的复杂性有一个非常基本的想法,但是,存在影响 GRU 网络性能的多个因素,包括层数、训练数据量(需要很大)、数量每层中的单元,时期和可能的正则化技术,随着时间的推移通过反向传播进行训练,我搞砸了。我在这里找到了一个关于神经网络复杂性的有趣答案使用反向传播训练神经网络的时间复杂度是多少?,但这还不足以消除我的疑问。
那么,使用时间反向传播来训练 GRU 网络的算法的时间复杂度是多少?
假设我们有一个 GRU 网络,其中包含层来处理训练数据集元组,特征,以及每一层的节点。
我对如何计算算法的复杂性有一个非常基本的想法,但是,存在影响 GRU 网络性能的多个因素,包括层数、训练数据量(需要很大)、数量每层中的单元,时期和可能的正则化技术,随着时间的推移通过反向传播进行训练,我搞砸了。我在这里找到了一个关于神经网络复杂性的有趣答案使用反向传播训练神经网络的时间复杂度是多少?,但这还不足以消除我的疑问。
那么,使用时间反向传播来训练 GRU 网络的算法的时间复杂度是多少?