在过采样/欠采样之后,无论使用何种采样方法,是否总是适合使用优势比调整概率?

机器算法验证 优势比 不平衡类 过采样
2022-03-15 08:23:13
  1. 我有一个不平衡的数据集,其中目标类小于样本的 1%。
  2. 我应用过采样或欠采样,例如https://github.com/scikit-learn-contrib/imbalanced-learn
  3. 我对重新采样的数据运行随机森林
  4. 我通过乘以优势比的比率将概率调整回原始样本,如下所述:https ://yiminwu.wordpress.com/2013/12/03/how-to-undo-oversampling-explained/

无论采用何种过采样或欠采样类型,第 4 步是否始终相同?

0个回答
没有发现任何回复~