我正在从 Pytorch 运行 DenseNet121,它具有相同的代码、相同的超参数和相同的图像大小,一次来自 jupyter 笔记本,一次通过 python 脚本使用命令行。笔记本版本给了我很好的结果(我也用当前的 SOTA 交叉检查了这个结果,这些结果与那个一致)但是脚本版本给了我非常非常糟糕的结果。这不是由于初始化中的随机性导致的不同结果 - 根据我的研究,脚本结果非常糟糕,它们根本不可能是真的。要了解差异:
- Notebook:测试集上的准确率 ~0.95,训练损失 ~0.14
- 脚本:测试集的准确率 ~ 0.62,训练损失 ~0.7
有谁知道为什么会发生这种差异?