时间序列数据的特征选择

机器算法验证 时间序列 特征选择 互相关
2022-03-10 17:34:33

我正在寻找时间序列数据的特征选择(或特征提取)方法。当然,我之前也做过一些研究,但并不令人满意。

我知道用于特征选择或提取的 PCA、随机森林的重要性矩阵、线性回归等方法,但这些方法是否也适用于时间序列数据?

任务是找到一组变量,这些变量可以很好地预测某个时间序列变量。

感谢您的任何建议!

2个回答

不久前,我也在搜索时间序列特征列表。有出版物检查单个功能,但我无法找到完整的功能列表。

tsfresh 自动提取特征

在从事工业机器学习项目时,我列出了自己的功能列表,这些功能在不同的应用程序中被证明是有用的。这个列表包含在 python 包tsfresh中,它允许自动提取大量特征并根据它们的重要性过滤它们。

时间序列特征的综合列表

因此,关于您的问题:您可以在此处有关 tsfresh 计算功能的综合文档中找到有关其他功能的灵感有简单的特征,例如平均值、时间序列相关的特征,例如 AR 模型的系数,或高度复杂的特征,例如增强的 dickey fuller 假设检验的检验统计量。

我相信您会在那里为您的应用程序找到一些有趣的功能。

免责声明:我是 tsfresh 的作者之一。

互相关函数将帮助您识别 X 变量中的关系。Box-Jenkins 在他们的教科书中讨论了这个问题。时间序列分析:预测和控制

当然,您还需要识别异常值,因为这种关系可能会受到这些事件以及趋势和水平变化的影响。

在散点图和折线图中以标准化形式绘制 Y 和 X 也将支持您的假设。