惩罚积极错误的指标

数据挖掘 预测建模 公制
2022-03-05 14:25:06

我参与了一个船舶运输时间预测项目。是关于预测一艘船的货物从港口 A 到 B 所需的时间,以便与最快的承运公司签约并告诉客户需要多长时间,因为几次承运公司花费或多或少(大多数时代更多)。

我们有带有预测变量和东西的历史数据库,关键是如果货物的实际运输时间是 10 天,模型估计的 9 天比 11 天更差,即使绝对误差为 1。

因此,需要一个自定义指标来惩罚正错误而不是负错误,并惩罚绝对大错误,调用错误 = 实际 - 预测。

我想使用加权均方误差,但我不知道如何平衡权重。你们可以帮助我吗?您知道其他一些符合该要求的指标吗?

非常感谢!

3个回答

如何使用指数和线性或多项式函数的差异?

例如,如果 predict ,则 正值的误差成本比负值增长得更快,并且是的可微函数。您可以根据典型错误和学习算法这是一个示例,对于x=actualpredicted

L=w1(ex1)w2x
xw1w2w1=w2=20

在此处输入图像描述

另一种直接的方法是使用 Pinball Loss 函数,您可以使用它来预测分位数。表示目标分位数,表示目标,表示分位数目标,弹球损失定义为:τyzLτ={(yz)τ,if yz(zy)(1τ),if y<z

这是分位数回归的标准损失,对于,这相当于标准损失,即预测条件中值。τ=0.501

唯一剩下的就是如何找到最佳目标分位数。这取决于手头的业务应用程序。假设欠预测成本和过预测成本,最优分位数定义为:cdowncoverτ=cdowncdown+cover

如果您对不可微的成本函数(或更准确地说是non-smooth)感到满意,则可以使用一个简单直观的度量标准,其中涉及定义为的阶跃函数θ(x)

θ(x)={1if x00if x<0

相对于阶跃函数定义的成本将是:

L(Δt)=w×θ(Δt)×Δt

并且它只惩罚正时间差,同时将零成本分配给负时间差Δt是一个自由参数权重,可以分配给任何值,例如)。w1