我需要一些帮助来评估卷积神经网络的训练结果。这是我的设置:
- 架构:InceptionV3
- 使用来自图像网络的权重预训练 InceptionV3
- 替换了最后一层,重新训练了网络的后半部分
- 分类:Softmax with cross entropy ploss
- 具有 keras 默认参数的 Adam 优化器
- 超参数:学习率 0.0001,批量大小 64
- 目标:具有专属标签的多标签分类
- 数据:从 0-16 的 17 个类别,总共 48.600 张图像
- 训练、测试、验证:80%、10%、10%
- 训练:2 epochs 只训练最后一层 + 2 epochs 训练网络的后半部分
结果
根据我的验证集,我创建了一个具有以下结果的混淆矩阵。
这里还有一些更多的每类性能指标:
如您所见,性能不是很好。测试准确率为 62.2%,所以也不是很好。查看混淆矩阵很明显,类别 0、2、3、7、10、11、13 和 14 从未被预测过。这些类的样本数量也最少。我想知道为什么会这样?这些类比其他类更罕见,但从不预测它们似乎很奇怪。你会推荐什么?

