我正在阅读Max Khun 的应用预测建模。在第 16 章中,他讨论了使用替代截止值作为类别不平衡的补救措施。
假设我们的模型预测 2 个事件 e1 和 e2 的最可能结果。我们有 e1 发生的预测概率为 0.52,而 e2 发生的预测概率为 0.48。使用标准的 0.5 作为 e1 截止值,我们将预测 e1,但使用替代的 0.56 截止值作为 e1,我们将预测 e2,因为我们仅在 p(e1) > 0.56 时预测 e1。
我的问题是,在使用交替截止时重新调整概率是否有意义。例如,在我之前的示例中,使用 e1 的 0.56 截止值。
p(e1) = 0.52;p(e2) = 0.48
然后我们应用 0.56 - 0.5 = 0.06 的调整。
所以
p_adj(e1) = 0.52 - 0.06 = 0.46; p_adj(e2) = 0.48 + 0.06 = 0.54
基本上我们改变概率,以便它们在 p_adj(e1) > 0.5 时预测 e1。
如果我的逻辑存在明显缺陷,我深表歉意,但是当 p(e1) > p(e2) 时预测 e2 对我来说直觉上是错误的。哪些概率更符合现实世界的概率?