我有一个包含两类元素的数据集。我还有两种方法可以为数据集中的每个元素分配(互补)概率属于任一类。
鉴于我使用概率(而不是硬 0,1 分类值),我被指出将评分规则作为评估哪种方法表现更好的一种方式。两个最常用的规则似乎是:
- 对数评分规则(对数损失、逻辑损失、交叉熵损失)
- Brier/二次评分规则(Brier score)
对数损失显然是标准方法(是吗?)。我还找到了 roc_auc_scorescikit-learn的
一个实现:
- 曲线下面积(AUC, ROC-AUC)
这似乎做几乎相同的事情。
我的问题是:其中任何一个在某种形式上本质上是否比另一个“更好”?我也可以只使用这三个。这是可取的吗?