我正在使用 k 折交叉验证为分类器生成混淆矩阵。当针对一堆输入数据运行时,我需要计算每个类的预测次数的 95% 置信区间。
因此,如果我在通过分类器运行 2000 个样本后的输出是:
Class A: 100
Class B: 1400
Class C: 500
我希望能够报告:
Class A: 100 +- (some value for a 95% interval)
Class B: 1400 +- (some value for a 95% interval)
Class C: 500 +- (some value for a 95% interval)
每个类的间隔将取决于分类器对该类的好坏程度,如混淆矩阵所示。
如果这有意义,请给我一些提示。否则请指点我一个更好的方向。我需要一些简单的东西来向不成熟的用户报告。