机器算法验证 - 通过多个时间范围预测时间序列 - 吾爱随笔录

假设我有一个小村庄人口的每日数据，由下式给出 $Y(t)$ ，以及与未来人口规模相关的各种因素的每日数据，由向量给出 $X(t)$ . 这些解释变量包括未转换的变量以及经过设计以提供长期信息的特征（例如，其中一个变量捕获了过去 30 天内的死亡人数）。我收集这些数据已经 8 年了。

我的目标是预测 $Y(t)$ 提前 1,2,3,...,365 天。我预计长期预测与短期预测不同。如果假期即将到来，我可能会预计几个月后会出现下降高峰（人们访问这座城市），但如果有人在临终前，那么我预计几天后会出现下降高峰。

由于人口足够少， $\Delta Y(t+k)$ 通常在 $\{-2,-1,0,1,2\}$ 对于所讨论的预测范围，我将使用多类别响应变量分类模型，该模型将概率分配给正在观察的各种类别标签。

我的问题集中在构建变化预测时需要考虑的具体事项 $Y(t)$ 到 $Y(t+k)$ 在哪里 $k$ 很大（例如 100 天）。

基本上会有最可怕的自相关结构 $\Delta Y(t+k)$ 在这些时间范围内。如果有人在那天死去 $2$ , 他们也死了 $3, 4, ..., k$ , 表示一串 $k$ 或者 $\Delta Y(t+k)$ 将包含相同的信息。

这些查询结果：