我有一个包含 4 个类的数据集,实例数量如下:
- 0类:13175
- 第一类:82
- 2级:75
- 第三类:121
已经应用了Python 不平衡学习 API中的几种子采样和过采样方法,但没有一个对所有类都有良好的性能。我已经申请:
- 欠采样:CondensedNearestNeighbour、EditedNearestNeighbours、NeighbourhoodCleaningRule、RandomUnderSampler。
- 过采样:SMOTE、ADASYN
- 我的网格搜索中的 class_weight:['balanced'] 参数选项
- costcla库,但它不能与两个以上的类一起使用。
而我没有成功。你能为这个问题提出一个解决方案吗?