贝叶斯误差/人为误差的估计

数据挖掘 贝叶斯错误
2022-02-23 02:08:00

在其中一门课程中,Andrew Ng 提到模型(机器学习)错误不能胜过贝叶斯/人类水平的表现,因此无法避免偏差......(不可避免的偏差)

我们如何确定/估计贝叶斯误差或人为误差,以便我们可以停止优化模型以进一步减少偏差?

分类问题的示例/概念将不胜感激......

1个回答

贝叶斯错误和人为错误是两个不同的概念。贝叶斯错误是任务中理论上可能的最低错误,不可能有更低的错误率。人为错误是人类可以执行的经验最低错误。

由于贝叶斯误差是理论上的,因此对于大多数非平凡的任务,贝叶斯误差必须基于领域知识进行估计。

人为错误可以通过让人执行任务来发现。

一个流行的例子是 ImageNet。当前的机器学习系统优于人为错误(top-5 错误率约为 4-5%)并迅速接近贝叶斯错误率(top-5 错误率 <3%)。