专家!也许,您知道如何计算 xgboost 的置信区间?具有 t 分布的经典公式无济于事,因为我的数据不是正态分布的。还是无所谓?
如果您建议一些文献,它将非常有用,但 R 和 Python 中的方法(在库 xgb 的上下文中)也很好。
也许,它看起来像这样,但它是如何计算的?并发现了这一点- 对还是错?
PS:我不能添加一些图片,与我的数据相关(链接限制),对不起。
所以,这就是答案! (镜子)
要为异常分布的数据构建置信限,您首先需要构建分位数回归,而不是默认情况下的线性回归。为此,有必要使用文章中的派生衍生物或简单地复制 python 上的代码来自定义变量“objective”。还需要改变梯度函数和高斯函数。一切编程完成后,为第 50 个分位数构建一个分位数回归(这将是初始回归),然后为区间的两个边界(例如,95 和 5)构建两个分位数回归。因此,您不仅可以获得更准确的初始回归模型,还可以获得所需的间隔。