所以我有一个深度学习模型和三个数据集(图像)。我的理论是,在训练深度学习模型时,其中一个数据集应该能更好地发挥作用(这意味着该模型将能够使用其中一个数据集实现更好的性能(更高的准确性)以服务于一个分类目的)
我只想在这里安全地检查我的方法。我了解训练深度学习模型的随机性以及与此类实验相关的困难。不过,我希望有人可以在这里指出一个危险信号。
我想知道这些事情:
您是否认为使用具有默认参数的优化器并重复训练过程,例如,对每个数据集进行 30 次并选择最佳性能是一种安全的方法?我在这里主要担心修改优化器的超参数可能会为假设其中一个数据集带来更好的结果。
播种权重初始化怎么样?你认为我应该播种它们然后修改超参数直到我获得最佳收敛或不播种并且仍然修改超参数吗?
我很抱歉我的问题很笼统。我希望有人能指出我正确的方向。