我最近发布了一个包含 369 个类的数据集(链接)。我对它们进行了一些实验,以了解分类任务的难度。通常,如果有混淆矩阵来查看所犯错误的类型,我会喜欢它。然而,一个 矩阵不实用。
有没有办法给出大混淆矩阵的重要信息?例如,通常有很多不那么有趣的 0。是否可以对类进行排序,以便大多数非零条目位于对角线周围,以便显示多个矩阵,这些矩阵是完整混淆矩阵的一部分?
这是一个大混淆矩阵的例子。
野外例子
EMNIST的图 6看起来不错:
很容易看出很多案例在哪里。然而,这些只是类。如果使用整个页面而不是仅使用一列,这可能是 3 倍,但这仍然只是类。甚至不接近 369 类 HASY 或 1000 类 ImageNet。