我在 sklearn 中使用 OneVsRest 分类器。所以一个多标签模型,每个类有 4 个模型(我有 4 个类)。因此,当我调用 predict_proba 方法时,我得到一个包含 4 列的数组,每列对应于该类的概率。例如
0 1 2 3
0.6 0.2 0.1 0.1
0.8 0.05 0.05 0.1
我知道所有模型都相互独立训练,并且指定的类即 0 1 2 3 是否采用 4 的 argmax。多标签分类的引擎盖下还会发生什么,使得每行总和为 1?为什么以及如何发生这种正常化。