目前正在阅读 Learning from Little:在很少训练的情况下分类器的比较
在3 Experiment Results中,共享以下图表:

实验描述如下
我们首先检查所有基准任务的平均 TP10 性能示例结果集,其中训练集有 P=5 正数和 N=200 负数。我们沿对数 x 轴改变选择的特征数量。
我将其理解为“我们使用一个包含 205 个元素的训练集,其中 5 个是正面的,剩下的 200 个是负面的”。但是从结果来看,使用信息增益的朴素贝叶斯和使用具有数百个特征的双正态分离的多项朴素贝叶斯最终在前 10 名中有 6.5 个真阳性(TP10 指标是真阳性的数量在分类器最强烈地预测为阳性的 10 个测试用例中发现)。
我会假设最接近 5/10 的模型将是最准确的,但阅读他们的结果,看起来越高越好。因此,感觉就像我忽略和误解了一些东西。有人可以在这个问题上启发我吗?
谢谢