机器算法验证 - RNN（或任何神经网络）如何成为参数模型？ - 吾爱随笔录

我正在阅读这篇论文A Multi-Horizon Quantile Recurrent Forecaster。作者指出：

3.1。损失函数

在分位数回归中，训练模型以最小化总分位数损失 (QL)：

$L_q(y,\hat{y})=q(y−\hat{y})_+ +(1−q)(\hat{y}−y)_+$

其中。 $(·)_+ = max(0, ·)$

当 q = 0.5 时，QL 就是平均绝对误差，它的最小值是预测分布的中位数。令 K 为预测层数，Q 为感兴趣的分位数，则矩阵是参数模型的输出，例如 RNN。（强调我的； in 是外部回归量） $K × Q$ $\hat{Y} = [\hat{y}_{t+k}^{(q)} ]_{k,q}$ $\boldsymbol{g(y_{:t}, x, θ)}$ $x$ $g(y_{:t}, x, θ)$

训练模型参数以最小化总损失 $\sum_t\sum_q\sum_kL_q(y_{t+k},\hat{y}_{t+k}^{(q)})$ ，其中 t 迭代所有预测创建时间 (FCT)。根据问题，总和的组成部分可以分配不同的权重，以突出或打折不同的分位数和范围。

为什么这个模型被认为是“参数的”？我认为神经网络在哪里定义为非参数？

是不是它输出了一组分位数，而不仅仅是一个使其参数化的点预测？但即便如此——他们使用上面定义的弹球损失来计算分位数，而不是预定义的分布——所以它对我来说仍然是非参数的。

这种方法如何被认为是参数化的？