我正在寻找时间序列数据的特征选择(或特征提取)方法。当然,我之前也做过一些研究,但并不令人满意。
我知道用于特征选择或提取的 PCA、随机森林的重要性矩阵、线性回归等方法,但这些方法是否也适用于时间序列数据?
任务是找到一组变量,这些变量可以很好地预测某个时间序列变量。
感谢您的任何建议!
我正在寻找时间序列数据的特征选择(或特征提取)方法。当然,我之前也做过一些研究,但并不令人满意。
我知道用于特征选择或提取的 PCA、随机森林的重要性矩阵、线性回归等方法,但这些方法是否也适用于时间序列数据?
任务是找到一组变量,这些变量可以很好地预测某个时间序列变量。
感谢您的任何建议!
不久前,我也在搜索时间序列特征列表。有出版物检查单个功能,但我无法找到完整的功能列表。
在从事工业机器学习项目时,我列出了自己的功能列表,这些功能在不同的应用程序中被证明是有用的。这个列表包含在 python 包tsfresh中,它允许自动提取大量特征并根据它们的重要性过滤它们。
因此,关于您的问题:您可以在此处有关 tsfresh 计算功能的综合文档中找到有关其他功能的灵感。有简单的特征,例如平均值、时间序列相关的特征,例如 AR 模型的系数,或高度复杂的特征,例如增强的 dickey fuller 假设检验的检验统计量。
我相信您会在那里为您的应用程序找到一些有趣的功能。
免责声明:我是 tsfresh 的作者之一。
互相关函数将帮助您识别 X 变量中的关系。Box-Jenkins 在他们的教科书中讨论了这个问题。时间序列分析:预测和控制
当然,您还需要识别异常值,因为这种关系可能会受到这些事件以及趋势和水平变化的影响。
在散点图和折线图中以标准化形式绘制 Y 和 X 也将支持您的假设。