为逻辑回归的估计生成预测区间是否有意义?

机器算法验证 物流 分类 预测区间 不确定
2022-03-26 09:46:24

假设我的二进制结果为 0 或 1,并假设我要使用逻辑回归模型来估计新样本的结果为 1 的概率。

我已经阅读了答案(例如这里:计算逻辑回归的预测区间),这些答案表明计算预测区间是荒谬的,因为结果只能是 0 或 1。

但是,在使用逻辑函数将预测区间转换为概率区间之前,是否有一种明智的方法来计算对数空间中的预测区间?

我的目标是能够在我做出的每个新预测中传达一定程度的不确定性(例如,“这种新产品估计有 0.40 的概率具有预期的结果,但这个估计的预测区间是 [0.3, 0.5 ]”)。

2个回答

在对数赔率空间中,每个结果都是或者,所以预测区间仍然没有意义。您可以通过给出概率的置信区间来实现您的目标。

这有点令人困惑。如果你在做逻辑回归,你预测二元类成员,例如,0 和 1。类标签基本上是阈值函数的结果,即

sigmoid(z)0.51, 否则为 0。

在哪里z=wTx(w=权重,x=样本),和sigmoid是逆 logit 函数11+ez

或者等效地保存这一步计算,您可以直接计算:

z01, 否则为 0。

条件概率p=sigmoid(z)基本上是你的“信心”。我想你想要的是这个概率的信心吗?您可以通过在线性尺度上计算预测的标准误差来做到这一点wTx,然后通过以下方式计算您的置信区间的上限和下限,例如 95%[pred.value+/1.96×std.err]. 获得上限和下限后,您可以使用 sigmoid 函数将它们转换为 logit 标度。