贝叶斯错误率的公式是如何推导出来的?

人工智能 分类 概率论 贝叶斯错误率
2021-10-26 10:54:11

我的问题涉及Wikipedia中贝叶斯错误率的特定表述,总结如下。

对于多类分类器,贝叶斯错误率可以计算如下:

p=1CiCmax,xxHiP(Ci|x)p(x)dx
在哪里x是一个实例,Ci是一个实例被分类到的类,Hi是分类器函数的区域/区域h归类为Ci.

我们对错误分类实例的概率感兴趣,因此我们希望总结每个不太可能的类标签的概率(因此我们想查看CiCmax,x)。

然而,积分让我感到困惑。我们想要整合一个与我们选择标签的概率相对应的区域Ci给定x. 但是我们画了xHi, 覆盖/分类的区域Ci,所以不会P(Ci|x)=1?

我认为如果有人可以帮助澄清积分的意图,我的大部分困惑都会得到解决。

是不是从总空间中抽取随机样本h(分类器函数),然后将每个分类的概率相加CiCmax,x? 如何x在被采样之前存在于外部总和中Hi在积分?

1个回答

贝叶斯错误率

对于 K 个不同类别的一般情况,正确分类 x 个实例的概率为:

P(correct)=i=1Kp(xHi,Ci)=i=1KxHip(x,Ci)dx=i=1KxHiP(Ci|x)p(x)dx

在哪里Hi是上课的地区i具有最高的后部。所以贝叶斯错误率是:

P(error)=1p(correct)=1i=1KxHiP(Ci|x)p(x)dx

如果我们画了要小心xHi, 覆盖/分类的区域Ci,P(Ci|x)1,因为这意味着我们肯定总是正确地预测。如果x属于一个决策区域,这并不意味着它属于相应的类。