假设我有一个二元分类问题。我最感兴趣的分类结果是经过良好校准的概率。
检查这一点的第一种方法是校准图(或可靠性曲线)。
问题:根据 Brier 分数判断校准是否足够公平?
假设我们有“足够”的数据。Brier 分数较小的分类器会提供更好的可靠性曲线吗?
我担心来自分类器的概率是条件概率这一事实。因此,我看不到将 Brier 分数应用于条件概率的直觉。
假设我有一个二元分类问题。我最感兴趣的分类结果是经过良好校准的概率。
检查这一点的第一种方法是校准图(或可靠性曲线)。
问题:根据 Brier 分数判断校准是否足够公平?
假设我们有“足够”的数据。Brier 分数较小的分类器会提供更好的可靠性曲线吗?
我担心来自分类器的概率是条件概率这一事实。因此,我看不到将 Brier 分数应用于条件概率的直觉。
简短的回答是,计算条件概率的 Brier 分数才有意义,, 在哪里是结果,是你的预测,并且是你的预测者。换句话说,是概率,以预测变量的这个特定值为条件,.
在这种情况下,布赖尔分数只是
还有哪些其他类型的概率?这里唯一的其他选择是边际概率,. 我们可以通过简单地计算次数的比例来估计这一点在数据中。显然,在计算 Brier 分数时使用这个值是没有意义的!
Brier 分数较小的分类器会提供更好的可靠性曲线吗?
是的。如果您的分类器预测在所有情况下和在哪里, 它的 Brier 分数为. 如果反其道而行之,则得分为. 在大多数情况下,这样完美的预测是不可能的,但一个好的分类器仍然可以很好地校准,例如通过预测在这种情况下一半的时间和其余的部分。执行此操作的分类器将在您的数据上获得最低的 Brier 分数。