- 我有一个不平衡的数据集,其中目标类小于样本的 1%。
- 我应用过采样或欠采样,例如https://github.com/scikit-learn-contrib/imbalanced-learn。
- 我对重新采样的数据运行随机森林
- 我通过乘以优势比的比率将概率调整回原始样本,如下所述:https ://yiminwu.wordpress.com/2013/12/03/how-to-undo-oversampling-explained/
无论采用何种过采样或欠采样类型,第 4 步是否始终相同?
无论采用何种过采样或欠采样类型,第 4 步是否始终相同?