pinball loss可以用来构建预测区间吗?

数据挖掘 预测建模 时间序列 损失函数
2021-10-01 19:33:05

我正在建模一些时间序列数据({yt}t) 并希望构建一个能够返回的模型不仅仅是单值预测yt^, 但是一个区间C=(是的^,lwer,是的^,pper) 这样 是的C有一定的概率。

现在,我了解了弹球损失:

大号(q,z)={qz, z >= 0 (q-1)z, z<0
如果我理解正确,q(0,1)是我想要预测的分位数,并且z 是实际值之间的差异 是的 以及我的模型所预测的 是的^. 如果对模型进行训练以针对某些情况优化此损失q,它将返回我的估计 是的^(q) 这样 (是的<是的^(q))=q. 这种解释正确吗?

那么,我可以简单地训练两个模型,比如说一个用于 q=0.05 另一个为 q=0.95 为了获得包含具有概率的实际值的区间的估计值 0.95-0.05=0.9?

1个回答

是的,您对弹球损失函数的解释似乎是正确的。对于和t之间的给定分位数,它为您提供阈值01v

那么,我是否可以简单地训练两个模型,比如一个用于 q=0.05,另一个用于 q=0.95,以便获得包含概率为 0.95−0.05=0.9 的实际值的区间的估计值?`

当然,如果你训练了两个模型来给出两个分位数的阈值,你可以说 p(是的^,lwer是的<是的^,pper)=|δ(q1-q2)|