从训练集中复制数据

数据挖掘 机器学习 训练
2022-03-10 14:25:13

在通过复制记录创建的更大训练集上训练的模型在测试数据上的表现是否比在没有重复的数据上训练的模型更好?

1个回答

为具有较少样本的类复制训练数据实际上可以提高您的准确性,这就是我们所说的Oversampling

但是,如果您有平衡的数据并尝试复制,那么它与再进行一次训练迭代/时期没有什么不同。