我发现自己可以计算大量 PR / ROC 曲线及其相关的 PR 曲线下面积 (AUPR) / ROC 曲线下面积 (AUROC)。
使用标准实现(我正在使用 sklearn 指标)甚至“手动”执行这些计算非常容易。然而,对于数百万个实例,精确计算对于探索性分析似乎不需要的精度非常耗时。
很长一段时间以来,我一直在寻找快速近似值。有些人建议优化精确计算,有些人建议对 AUROC 进行一些近似。
但是我们对快速 PR/ROC 曲线计算有很好的近似吗?
我发现自己可以计算大量 PR / ROC 曲线及其相关的 PR 曲线下面积 (AUPR) / ROC 曲线下面积 (AUROC)。
使用标准实现(我正在使用 sklearn 指标)甚至“手动”执行这些计算非常容易。然而,对于数百万个实例,精确计算对于探索性分析似乎不需要的精度非常耗时。
很长一段时间以来,我一直在寻找快速近似值。有些人建议优化精确计算,有些人建议对 AUROC 进行一些近似。
但是我们对快速 PR/ROC 曲线计算有很好的近似吗?