0.5典型分类器输出的解释是什么?
我做了一个预测,该数据点来自 True 类的概率为 0.5。
0.5典型分类器输出的解释是什么?
我做了一个预测,该数据点来自 True 类的概率为 0.5。
根据您的算法,它可能有不同的解释。
假设您使用的是SVM with kernels,这意味着您的输入数据恰好位于具有不同类的两个数据点之间,或者如果您linear kernels在SVM中使用,则意味着您的数据位于分隔线上。
如果您使用神经网络,这是每个类的概率。在这种情况下,这种现象可能有不同的解释。
也可能存在另一种解释。假设您的两个类的数据集不平衡。假设两个类有相同的特征向量。在这种情况下,您的样本分布重叠。具有更多数据样本的类将成为赢家,并且将比样本较少的类占据更多空间。在这种情况下,如果你得到 50% 作为输出,你不能说这两个类有相同的期望。
如果我想进一步澄清这一点,我会用这个例子来做。假设您有一个汽车分类器来区分白色和蓝色汽车。在训练期间,您有100张蓝色汽车的图像和20张白色汽车的图像。在召回阶段,如果对于任意图像,每个类别都有 50%,那么您永远不能说图像具有相同的概率成为每个类别
.