假设我们必须对神经网络架构 A 和 B 进行训练,每个架构都训练次。基于次再训练,我们可以计算每个模型的这意味着,对于模型 A,我们有一个错误密度 ,对于 B ,我们有一个密度。
显然,如果 A <误差的标准差,我会选择 A 作为我的最佳模型。但是如果但,我们如何选择模型。
我的问题一般是:给定两个错误密度和,什么指标比较这两者来选择最终模型。我想到的简单且可能不正确的方法是:决定参考密度(您喜欢错误密度如何,例如)并使用 KL -divergence 计算每个 A 和 B 密度与参考密度之间的“距离”,并选择距离较小的模型。
有任何想法吗 ?