假设我正在尝试对医疗状况进行分类。
只有两个类别:生病和健康。
我建立了一个模型,但我无法拆分数据,因为我不希望来自同一患者的数据在训练和测试集中。所以我选择使用 Leave-One-Subject-Out,在除一个以外的所有主题上训练模型,并在剩下的主题上进行测试。
因此,对于每个测试集,我都有一个主题,他们要么健康,要么生病。因此,混淆矩阵只包含一个类别,其中精度在技术上每次都是一个,并且召回等于准确度。
我一直在阅读一些论文,这些论文声称在患者有健康状况或没有健康状况的情况下使用离开主题训练和测试拆分。我看过报告准确性、召回率和精确度的论文,但我不明白如果每个主题只包含一个类,那么精确度怎么可能小于 1。我怀疑这些论文是在撒谎,因为我不止一次看到过这种情况。
我只想知道这里发生了什么让他们获得小于一的精度值。他们是在做某种平均,还是我错过了一些东西并以错误的方式思考这个问题?也没有任何论文解释这一点。