数据挖掘 - 解释卷积网络中的混淆矩阵和验证结果 - 吾爱随笔录

我需要一些帮助来评估卷积神经网络的训练结果。这是我的设置：

架构：InceptionV3

使用来自图像网络的权重预训练 InceptionV3

替换了最后一层，重新训练了网络的后半部分

分类：Softmax with cross entropy ploss

具有 keras 默认参数的 Adam 优化器

超参数：学习率 0.0001，批量大小 64

目标：具有专属标签的多标签分类

数据：从 0-16 的 17 个类别，总共 48.600 张图像

训练、测试、验证：80%、10%、10%

训练：2 epochs 只训练最后一层 + 2 epochs 训练网络的后半部分

结果

根据我的验证集，我创建了一个具有以下结果的混淆矩阵。

这里还有一些更多的每类性能指标：

如您所见，性能不是很好。测试准确率为 62.2%，所以也不是很好。查看混淆矩阵很明显，类别 0、2、3、7、10、11、13 和 14 从未被预测过。这些类的样本数量也最少。我想知道为什么会这样？这些类比其他类更罕见，但从不预测它们似乎很奇怪。你会推荐什么？