我很惊讶我找不到任何关于如何将先验类概率分布纳入逻辑回归或随机森林等分类器的文章/讲座。
所以我的问题是:
如何将先验概率分布纳入逻辑回归或随机森林?
合并先验概率分布是否意味着我应该使用贝叶斯机器?
我面临一个分类任务,我知道 a 类比 b 类更有可能。
一个临时的解决方案是在训练集中只包含更多的 a 类样本,但是这方面有什么理论结果吗?
我想到的一件事是将决策阈值从 0.5 更改为考虑到这种先前不平衡的值。但我什至不确定这在理论上是否有意义,因为在我准备做出决定的时候,我已经查看了所有特征值,所以我不应该关心先验概率,而应该关心类条件概率。