我已经阅读了 Alexandru Niculescu-Mizil 和 Rich Caruana 的论文“从 Boosting 中获取校准概率”以及该线程中的讨论。但是,我仍然无法理解和实现逻辑或Platt 的缩放来校准我的多类提升分类器的输出(带有决策树桩的温和提升)。
我对广义线性模型有点熟悉,我想我了解逻辑和 Platt 的校准方法如何在二进制情况下工作,但我不确定我是否知道如何将论文中描述的方法扩展到多类情况。
我使用的分类器输出以下内容:
- =分类器为类投的票数对于样品正在分类的
- = 估计等级
在这一点上,我有以下问题:
Q1:我需要使用多项式 logit 来估计概率吗?或者我仍然可以使用逻辑回归来做到这一点(例如以1-vs-all 的方式)?
Q2:我应该如何定义多类案例的中间目标变量(例如 Platt 的标度)?
Q3:我知道这可能有很多问题要问,但是有人愿意为这个问题画出伪代码吗?(在更实际的层面上,我对 Matlab 中的解决方案感兴趣)。