我为二元分类问题建立了一个随机森林模型。目标变量中的两个类都是平衡的。我感兴趣的主要课程是“1 级”。
假阴性对我来说成本更高,因此通过优化召回来减少假阴性更有意义。
我在网上读到,我可以为我的类分配权重以惩罚假阴性(基本上是类 1 的错误分类)或使用精确召回曲线优化阈值以提高类 1 的召回率。
我的情况(两个类几乎是平衡的)哪种方法会更好?我仍然可以分配类权重来惩罚假阴性吗?如果是,我如何确定要应用于每个类的权重?或者优化阈值更好?
这是我的分类报告: