回归数据增强

数据挖掘 深度学习 回归 数据增强
2021-09-22 20:41:43

我想使用深度学习进行回归。但是,训练样本的数量并不大。在图像处理中,通过旋转等任务在初始数据的基础上生成一些新的样本,以增加数据集的数量。我可以知道是否有任何算法可以根据当前样本生成更多数据(回归数据增强)?

2个回答

是的,你可以以你希望你的模型稳健的方式扰乱你的数据(和目标),例如通过添加少量噪声(可能是高斯)或合成异常,或者通过创建有意义的聚合。一些模型也可以通过多次运行相同的训练数据来改进,随机打乱(“epochs”)。

您可以尝试 SMOTE 之类的方法,看看您新生成的数据是否符合您的要求。如果您的数据具有统计模型,您可以使用适当的参数模型来生成数据。您甚至可以尝试非参数估计等方法,例如 Parzen 窗口等。所有这些都取决于您迄今为止处理的图像数据的统计拟合。

与 SMOTE 类似的其他方法:ADASYN、Boundary SMOTE 等(在互联网上查找)

注意:将 SMOTE 应用于已经处理的图像数据,例如您已经没有直接在图像本身上的训练数据。