机器算法验证 - 不规则时间间隔的RNN？ - 吾爱随笔录

机器算法验证机器学习神经网络 lstm 循环神经网络不均匀间隔时间序列

2022-02-04 00:06:37

RNN 非常适合捕获序列数据的时间依赖性。但是，当序列元素的时间间隔不相等时会发生什么？

例如，LSTM 单元的第一个输入发生在星期一，然后从星期二到星期四没有数据，最后是星期五、星期六、星期日的每个新输入。一种可能性是在周二到周四提供某种 NULL 向量，但这似乎是一个愚蠢的解决方案，因为 NULL 条目会污染数据，而且会浪费资源。

有任何想法吗？RNN 如何处理这种情况？如果还有 RNN 以外的方法，我也欢迎这些建议。

4个回答

简而言之，我写了处理稀疏/不规则顺序数据问题的不同方法。

以下是尝试方法的简短概述：

希望这有助于为您指明正确的方向:)

如果您正在输入一些数据向量 $v_t$ 有时 $t$ , 直接的解决方案是获取星期几的 one-hot 编码, $d_t$ ，然后简单地将 $v_t$ 和 $d_t$ . 如果时间格式比星期几更复杂，那么时间/日期编码方案可能会更复杂。

此外，根据数据的稀疏和不规则程度，NULL 条目应该是一个合理的解决方案。我怀疑 LSTM 的输入门将允许 LSTM 正确读取 NULL 条目的信息，而不会污染您输入的数据（内存/隐藏状态）。

我会尝试将时间间隔明确地合并到模型中。例如，传统的时间序列模型（如自回归 AR(p)）可以被认为是连续时间模型的离散化。例如，AR(1) 模型：

y_{t} = c + ϕ y_{t - 1} + ε_{t}

$y_t=c+\phi y_{t-1}+\varepsilon_t$ 可以被认为是一个版本：

y_{t} = c Δ t + e^{- γ Δ t} y_{t - Δ t} + ξ_{t} σ \sqrt{Δ t}

$y_t=c\Delta t+e^{-\gamma\Delta t}y_{t-\Delta t}+\xi_t\sigma\sqrt {\Delta t}$

你可以类比 RNN 的时间序列模型。例如， $\phi$ 在 AR(1) 过程中可以看作是 RNN 中的记忆权重。因此，您可以通过这种方式将观察之间的时间差插入到您的特征中。我必须警告这只是一个想法，我自己还没有尝试过。

我认为这取决于数据。例如，如果您正在处理计数并且您只是在某些日子忘记测量它，那么最好的策略是估算缺失值（例如，通过插值或高斯过程），然后使用 RNN 处理估算的时间序列。通过估算，您将嵌入知识。

如果缺失是有意义的（在某些日子里太热太测量计数），那么最好进行估算，并附加一个指示向量，如果值缺失则为 1，否则为 0。

其它你可能感兴趣的问题