我用 CIFA10 数据集做实验。在我的模型中,我发现批量越大,模型对数据集的学习效果就越好。从我在互联网上看到的典型尺寸是 32 到 128,我的最佳尺寸是 512-1024。可以吗?或者有什么我应该看的东西来改进模型。我应该使用哪些指标来调试它?
PS 似乎梯度太嘈杂了,如果我们有更大的样本量,它会降低噪音。
我用 CIFA10 数据集做实验。在我的模型中,我发现批量越大,模型对数据集的学习效果就越好。从我在互联网上看到的典型尺寸是 32 到 128,我的最佳尺寸是 512-1024。可以吗?或者有什么我应该看的东西来改进模型。我应该使用哪些指标来调试它?
PS 似乎梯度太嘈杂了,如果我们有更大的样本量,它会降低噪音。