我知道在 H2O 中没有特定的时间序列建模模型。是否有解决方法来使用深度学习或/和 GBM?是否需要某种数据转换?有什么例子吗?
ARIMA 或 LSTM 有什么计划吗?
我知道在 H2O 中没有特定的时间序列建模模型。是否有解决方法来使用深度学习或/和 GBM?是否需要某种数据转换?有什么例子吗?
ARIMA 或 LSTM 有什么计划吗?
您可以将 H2O 用于时间序列,并且通常会进行一些数据工程来创建基于时间的特征。在我的书(Practical Machine Learning with H2O)中,三个主要数据集之一是足球比赛结果的预测,因此展示了一些技术。
我通常在 R 中做类似arimaand之类的事情adf.test,并将输出用作我加载到 H2O 中的特征。尽管如果您的数据集不适合内存(这是 H2O 相对于 R 的主要优势之一),这并不理想。有两个功能请求,您可以评论或投票:https ://0xdata.atlassian.net/browse/PUBDEV-2590和https://0xdata.atlassian.net/browse/PUBDEV-4153,但它似乎还没有人在研究它们。
LSTM 应该可以使用 DeepWater 从 H2O 获得(即使用 TensorFlow 或 MxNet 作为后端)。我自己仍在寻找专门针对此的教程。
专为时间序列设计的方法比黑盒机器学习算法更适用于此类数据,例如本博客条目中所示。时间序列模型考虑了数据的时间依赖性,而通用方法则没有。当然,您可以在数据中添加带有 lags 的附加列,但是您仍然会假设是一些不同的变量,不必有任何共同点, 或者...您可以考虑对数据进行一些更复杂的转换,以便尝试模仿时间序列模型所做的事情,但是,为什么要重新发明轮子..?
至于 H2O,你应该问作者。(但是,由于它是通用机器学习软件,所以我怀疑他们是否会对实现一些专门的模型感兴趣。)