我想在一个不平衡的数据集上测试我训练有素的模型。是否有任何算法可用于从平衡的标记数据集(垃圾邮件/非垃圾邮件)生成合成数据?
创建不平衡数据集
机器算法验证
不平衡类
合成数据
2022-03-16 07:57:28
1个回答
试试SMOTE,它是一种用于过采样的算法。它从您想要过度采样的类中创建合成样本。
您可以使用它来创建所需的任意数量的样本。
其它你可能感兴趣的问题