我的数据集中的样本数量在每类 3800 到 100,000 之间。想知道我的神经网络是否会更偏向于具有更多图像的类。我正在尝试使用 Keras 的预训练 resnet152V2 模型。
我的 CNN 结果将如何受到某些类别中样本数量之间的巨大差异的影响?
数据挖掘
深度学习
喀拉斯
数据集
图像分类
计算机视觉
2022-02-13 14:04:18
1个回答
这是一个经验性问题,可以通过实验定性地回答。您可以使用不等数量的样本训练一个版本,并使用相同数量的样本训练另一个版本。可以比较这两个版本之间的结果,以了解偏差是如何由于类别不平衡造成的。