如何获得预测的置信度分数?

数据挖掘 机器学习 神经网络 回归 决策树 xgboost
2021-10-03 11:26:01

在回归问题中,是否可以计算给定模型(如 XGBoost 或神经网络)的某个预测的置信度/可靠性分数?

1个回答

无论模型如何,您始终可以使用非参数引导程序为任何参数构建置信区间,包括预测(实际上是随机变量本身,但报告为预期)。这是一般程序:

  1. N表示训练数据中的观察次数X, 和xj表示其预测的特定观察,y^j,你想要一个CI。
  2. K表示一些重采样迭代次数(必须是20对于具有覆盖范围的 CI95%)
  3. 为了iK, 画一个N随机样本来自X更换。表示这个Xi
  4. 训练模型Xi并使用这个模型来形成一个预测xj. 调用这个y^ji
  5. 估计分布参数 y^j从您的样品中。一个100α CI由 α2100α2 的百分位数 y^j.