置信区间是对某个参数的某个真实值的区间估计。让我们(作为示例)从正态分布均值的置信区间开始,然后继续讨论 ROC 和 AUC,以便看到类比。
假设您有一个随机正态变量X∼N(μ;σ). 在哪里μ是未知总体均值,为了简单起见,我们假设σ是已知的。
我们现在画一个大小的样本n从X的分布,即我们得到一个样本x1,x2,…xn. 目标是对未知有一个想法μ使用抽取的样本。众所周知,算术平均值x¯=1n∑ixi是(未知数)的无偏(点)估计量μ然后[x¯−1.96σn√;x¯+1.96σn√]是一个95%(未知数)的置信区间μ.
如果我们再画一个样本y1,…,yn从分布X然后,以同样的方式,我们将找到(未知)的另一个置信区间μ作为[y¯−1.96σn√;y¯+1.96σn√].
所以每次我们抽取一个大小的样本n从分布X,我们找到(未知)的置信区间μ所有这些间隔都会有所不同。 事实上,它是一个95%置信区间意味着,如果我们绘制“无限”个大小的样本n从分布X,并且对于这些样本中的每一个,我们计算95%置信区间,则95%所有这些间隔(每个样本一个间隔)将包含未知数μ. (所以有时,即5%的区间,这样的区间将不包含未知数μ,所以有时你运气不好。)
AUC 也是如此,当您计算 AUC 时,您从样本中计算它,换句话说,您计算的是对真实未知AUC的估计。同样,对于您拥有的样本,您可以计算真实但未知的 AUC 的置信区间。如果您能够绘制无限数量的样本,并且为获得的每个样本计算真实 AUC 的置信区间,则95%这些计算的间隔将包含真实但未知的 AUC。
请注意,间隔是随机的,因为它是从随机样本中计算出来的。真正的 AUC 不是随机的,它是您的人口的一些未知属性。
不幸的是你不能画出无限数量的样本,大多数时候你只有一个样本,所以你必须用一个间隔来做,但你很有信心(95%如此计算的区间将包含真实的未知 AUC),该区间将包含真实的 AUC。是的,如果区间的下边界大于 0.5,那么您可以相当确信您的模型不是随机模型,但是,如上所述,您的样本也可能运气不好。