我对高方差的理解是目标分布广泛。输出值“无处不在”。
在二元分类模型中,只能有 2 个结果。在可视化二元分类模型中的高方差意味着什么时,我不知所措。
我对高方差的理解是目标分布广泛。输出值“无处不在”。
在二元分类模型中,只能有 2 个结果。在可视化二元分类模型中的高方差意味着什么时,我不知所措。
您已经正确地直觉到,在这种情况下,方差不是一个有用的概念。统计学家通常会转而查看二项式偏差(请参阅此处了解全面的技术发展)。
如果您确实想考虑方差,我们可以认识到许多二元分类器输出标签的估计值 . 在这里考虑一个随机分类器会有所帮助,该分类器估计(称这个估计) 并生成有概率,否则。我们有当分类器在看到协变量后对分类更加确定时,这将更小。即,如果始终为 1 或 0,则方差为 0(但当然偏差会很大)。如果训练数据中每个类的数量相等,并且分类器无法从协变量中学到任何东西,那么对于任何所以方差是——正如我们所料,抛硬币。