我用老鼠进行声音检测实验。我有一个刺激声音和一个应该被忽略的“噪音”声音。
我想测量鼠标忽略噪音的程度(例如,忽略 100% 的噪音刺激)。
我进行了一些会话,例如 200 次应该检测到的刺激声音试验和 40 次应该被忽略的噪声试验。
我创建了混淆矩阵和 ROC 曲线(我使用 Matlab)。现在我想知道与“忽略所有噪声刺激”相比,我的鼠标性能如何。
有没有办法或常用公式来获得“我的 ROC AUC 与 AUC(ROC) = 1 相比有多好”的评估或置信区间?
谢谢!
AUC 是数据集的汇总统计量。因此,如果您再次进行相同的实验,您将获得稍微不同的值 - 如果重复多次,您将获得值的分布。您可能希望表明您的分布很少或从不包含 0.5(表示随机分类)。当您有这样的经验分布或重复实验的直方图时,您可以只计算您的估计有多少≈0.5≈0.5. 如果没有,你就是金子。
由于您不想多次进行实验,您可以通过使用数据样本来“模拟”该场景,但执行相同的过程。这称为“引导”。您可以使用此方法围绕您的 AUC 指标构建置信区间,或者等效地进行统计测试以查看您获得的指标是否不同于 0.5。
一些软件包在 AUC 计算中内置了自举置信区间,因此您可以使用它。