数据挖掘 - 我的 CNN 结果将如何受到某些类别中样本数量之间的巨大差异的影响？ - 吾爱随笔录

数据挖掘深度学习喀拉斯数据集图像分类计算机视觉

2022-02-13 14:04:18

我的数据集中的样本数量在每类 3800 到 100,000 之间。想知道我的神经网络是否会更偏向于具有更多图像的类。我正在尝试使用 Keras 的预训练 resnet152V2 模型。

1个回答

这是一个经验性问题，可以通过实验定性地回答。您可以使用不等数量的样本训练一个版本，并使用相同数量的样本训练另一个版本。可以比较这两个版本之间的结果，以了解偏差是如何由于类别不平衡造成的。

其它你可能感兴趣的问题