假设您有一个分类任务,并且您关心的是准确性。现在是旧系统准确度为和一个新系统准确度为. 这是一个绝对的改进个百分点和相对改善.
然而,当你现在试图获得一个系统这似乎要困难得多,尽管这只是一个绝对的改进和相对改善. 因此,无论是绝对精度还是相对精度差异似乎都无法很好地捕捉到这一点。
有没有其他常见的方法来量化系统有多好?
假设您有一个分类任务,并且您关心的是准确性。现在是旧系统准确度为和一个新系统准确度为. 这是一个绝对的改进个百分点和相对改善.
然而,当你现在试图获得一个系统这似乎要困难得多,尽管这只是一个绝对的改进和相对改善. 因此,无论是绝对精度还是相对精度差异似乎都无法很好地捕捉到这一点。
有没有其他常见的方法来量化系统有多好?
在高精度状态(>0.9)中,我查看错误率——准确度的补充——或其倒数;错误之间的平均时间。这抓住了直觉,即 0.99 的准确度是 0.9 的准确度“好”的十倍。