我正在阅读这篇论文A Multi-Horizon Quantile Recurrent Forecaster。作者指出:
3.1。损失函数
在分位数回归中,训练模型以最小化总分位数损失 (QL):
其中。
当 q = 0.5 时,QL 就是平均绝对误差,它的最小值是预测分布的中位数。令 K 为预测层数,Q 为感兴趣的分位数,则矩阵是参数模型\boldsymbol{g(y_{:t}, x, θ)}的输出,例如 RNN。(强调我的;x in g(y_{:t}, x, θ)是外部回归量)
训练模型参数以最小化总损失,其中 t 迭代所有预测创建时间 (FCT)。根据问题,总和的组成部分可以分配不同的权重,以突出或打折不同的分位数和范围。
为什么这个模型被认为是“参数的”?我认为神经网络在哪里定义为非参数?
是不是它输出了一组分位数,而不仅仅是一个使其参数化的点预测?但即便如此——他们使用上面定义的弹球损失来计算分位数,而不是预定义的分布——所以它对我来说仍然是非参数的。
这种方法如何被认为是参数化的?