分类器模型的标准差

数据挖掘 分类 预报
2022-02-21 19:21:21

我来自线性/逻辑回归的世界,其中残差被认为是正常的,并且输出包括某种可以用来进行预测的残差标准误差。诚然,我在拟合和解释多项式模型方面经验很少。

无论如何,我正在考虑一个特定的问题:

假设我们有很多关于已经投票的选民的数据。有了这些数据,我们希望训练一个模型来预测未来的选举。

从正常回归的世界来看,预测每张选票似乎存在标准错误,这些错误可能会被相加,从而为每位候选人的选票总和创建一个随机变量。然后可以使用这些随机变量来尝试预测每个候选人获胜的概率。

我的问题是,例如使用随机梯度下降分类器等工具评估分类器模型的“标准误差”的标准方法是什么。或任何更现代的分类工具。某种引导方法?

1个回答

分类器通常在交叉熵或其他散度上评分,因为我们谈论的是分布。多类分类器将为您提供与每个类(选项、结果)相关的“分数”。将此分数转换为概率通常很容易,因此选项加起来为 1。此外,可以将每个类与置信分布相关联。我不知道这是否是您要问的,但这里有一篇很棒的博客文章