我见过很多地方都有输入/输出数据集,他们首先创建线性回归线,纠正偏差,然后只将这些数据用于他们的模型。我没有得到这个偏差校正是什么?
什么是偏差校正?
机器算法验证
偏见
偏差校正
2022-03-26 07:08:01
1个回答
尽管问题陈述不够精确,无法确切知道您指的是哪种类型的偏差校正,但我想我可以笼统地谈论它。有时,估计器可能有偏差。这仅仅意味着虽然它可能是一个很好的估计量,但它的预期值或平均值并不完全等于参数。估计器的平均值与真实参数值之间的差异称为偏差。当已知估计量有偏差时,有时可以通过其他方式估计偏差,然后通过从原始估计中减去估计的偏差来修改估计量。此过程称为偏差校正。这样做是为了改进估计。虽然它会减少偏差,但也会增加方差。
成功偏差校正的一个很好的例子是分类错误率的引导偏差校正估计。当样本量较小时,错误率的重新替换估计具有较大的乐观偏差。bootstrap 用于估计重新替换估计的偏差,并且由于重新替换估计低估了错误率,因此将偏差估计添加到重新替换估计以获得错误率的 bootstrap 偏差校正估计。当样本量小于或等于 30 时,在一个两类问题中结合两个类时,某些形式的 bootstrap 估计(特别是 632 估计)提供了比留一法交叉验证更准确的错误率估计(这是一个非常错误率的几乎无偏估计)。
其它你可能感兴趣的问题