Cross Validated 喜欢在“分类”问题中推广正确的评分规则。也就是说,得到准确的概率预测。然后进行分类,考虑到错误分类的成本。这适用于医学诊断等情况,正如弗兰克哈雷尔所说,医生对概率最感兴趣。即使是垃圾邮件检测任务(计算机通过将电子邮件放入离散桶中自动处理)也具有概率校准的作用。
然而,我看不到调整概率的作用的一个地方是光学字符识别。我们将打印的文档粘贴到扫描仪中,它将字母的图像转换为字母的文本。据我所知,我们只关心生成的文本有多准确。
如果我的唯一目标是训练一个准确的分类器,那么寻求真实概率的适当评分规则的作用是什么?
光学字符识别是否一步完成统计和决策?
如果我只是要根据模型将最高类别概率分配给正确角色的能力来评估模型,为什么还要使用正确的评分规则作为损失函数?