Brier 分数是否适用于有序分类数据?

机器算法验证 预测 brier分数
2022-03-25 04:50:36

根据维基百科,布赖尔分数的“原始定义”是:

BS=1Nt=1Ni=1R(ftioti)2

其中是类数,是预测实例数,是属于第个类个实例的预测概率是结果( )。RNftitioti01

我有一些数据,人们预测下一季度的失业率是<2.5%、2.5-5%、5-7.5%还是>7.5%。所以它是有序的分类数据。受试者需要预测失业率属于这些类别的概率,并且它们的概率之和需要为 1。有人鼓励我使用 Brier 分数来评估个人预测者的表现,但有些事情让我感到困扰。

考虑第 1 个人:

第 1 人的 Brier 分数

第一个人真的不知道如何预测失业。这个人只是给所有四个类别分配了相等的概率,最终得到的 Brier 分数为 0.06 + 0.06 + 0.06 + 0.56 = 0.75。

然后比较第 2 个人:

第 2 个人的 Brier 分数

人 2 有一些知识表明失业率会很高。正确的类别是“>7.5% 的失业率”,并且第 2 个人认为发生这种情况的概率为 0.3 - 因此第 2 个人在这方面的表现优于第 1 个人。第 2 个人认为失业率为 5-7.5% 的概率为 0.7。

第 2 个人的 Brier 分数为 0 + 0 + 0.49 + 0.49 = 0.98。所以根据 Brier 评分,第 2 个人比第 1 个人差。

我觉得这很违反直觉,因为第 2 个人实际上知道他们在做什么,而且比第 1 个人分配了更高的概率(0.3 对 0.25)。

  1. 在我的特殊情况下这是一个问题吗?

  2. 假设在我的特定情况下这是一个问题,如果类别真的是名义上的而不是有序的类别,那会好吗?

  3. 假设在我的情况下这是一个问题,我应该使用什么来代替 Brier 分数?

1个回答
  1. 在您的情况下,Brier 分数仍然“有效”,因为它激励您陈述真实的预测分布(这是一个适当的评分规则,请参阅Gneiting 和 Raftery,2007 年)。例如,如果真实概率是 0、1/4、1/4、1/2,您可以通过实际陈述这些概率来最小化您的预期 Brier 分数。
  2. 3. Brier 分数适用于名义数据和有序数据。但是,正如您的示例所示,它不关心已实现的箱旁边的箱中的预测概率。这是否有问题在很大程度上是一个哲学问题。如果你不喜欢 Brier 分数的这个特性,你可以使用Ranked Probability Score,定义为 其中是事件的 Brier 分数结果位于前个类别中(粗略地引用上面链接的帖子)。在您的示例中,人 1 的 RPS 为而人 2 的 RPS 为
    RPS=i=1rBS(i),
    BS(i)i
    RPS1=0.252+0.52+0.752+02=0.875,
    RPS2=02+02+0.72+02=0.49,
    因此优于第 1 个人。请注意,与 Brier 分数一样,RPS 也是一个适当的评分规则(因此从统计理论的角度来看是合理的)。