用于对不平衡时间序列数据集进行分类的数据增强技术

数据挖掘 分类 时间序列 阶级失衡 数据增强
2022-02-17 20:52:21

现在我的任务是使用 ML 分类器对不平衡的时间序列数据集进行分类,例如 Logistic 回归、决策树、SVM 和 KNN。我不允许使用深度学习工具,例如 CNN 和 RNN。时间序列数据是来自生产线的力-位移曲线的测量值。数据集极度不平衡(少数类:多数类= 1:100)。所以我想使用数据增强技术来扩大少数类的大小,以优化分类器的性能并避免过度拟合。

我在特征空间中尝试了很多工具,例如过采样、欠采样、SMOTE、ADASYN 等。但他们的表现并不是那么完美。我希望基于初始数据使用数据增强技术生成合成时间序列数据。与图像识别类似,我也尝试了已应用于图像的现有方法,例如缩放、旋转和抖动。但它们也不是那么有用。

所以我想问一下是否还有其他 DA 技术可以生成合成时间序列数据。我只有一些初步的想法,比如使用DTW、Fournier Transform、Markov Chain等,但没有关于应用它们的论文或代码。

谁能帮我?我真的很感谢你的帮助。谢谢!

0个回答
没有发现任何回复~