从原始传感器数据中提取时间序列特征进行分类?

数据挖掘 时间序列 特征选择 特征提取 多类分类 特征工程
2021-10-08 00:12:58

我有一个来自带有相关标签的传感器的表格原始数据,我想从所有传感器数据的数据中提取时间序列特征,如平均值、最大值、最小值和标准差,并形成另一个表或导出到 csv 文件,以便我可以进行分类该数据的任务。

数据表

在此处输入图像描述

4个回答

澄清一下:mean,max,min,std不是“时间序列特征”,它们通常是数据特征。

假设你想在 python 中做,你应该看看pandas.DataFrame类。使用表格数据初始化 Dataframe 对象后,您可以调用其方法DataFrame.min(), DataFrame.max(), DataFrame.mean(),DataFrame.std()以达到您的目的。

您可以将所有这些计算的特征插入到的DataFrame 中,然后调用Dataframe.to_csv()以将它们导出到csv文件中。

也许您需要查看这篇关于使用信号处理技术进行机器学习的独立博客文章,了解如何准备时间序列数据并为机器学习模型提取有用的统计估计和特征。最后给出一个分类示例。我发现它非常有用且简单明了。

在文章中间的某个地方,还介绍了这种检测数据峰值的好方法。

我没有足够的声誉发表评论,但您能否提供一些示例数据,以便我们更好地帮助您?

当您说平均值、最大值、最小值时,您是在尝试使用这些函数在日期列上聚合多行数据吗?或者,您是否有要使用的时间跨度/日期时间/时间戳列?