我正在使用朴素贝叶斯分类器在两组数据之间进行分类。一组数据比另一组大得多(4 倍以上)。我在分类器中使用每个组的先验概率。
问题是我得到的结果有 0% 的真阳性率和 0% 的假阳性率。当我将之前设置为 0.5 和 0.5 时,我得到了相同的结果。
如何将阈值设置为更好的值,以便获得更平衡的结果?
使用逻辑回归分类器时我遇到了类似的问题。我通过从偏差中减去前一项来解决它。
当我对这些数据使用 Fisher 线性判别式时,我得到了很好的结果,其中阈值设置在中间。
我认为这个问题有一些常见的解决方案,我只是找不到。
更新:我刚刚注意到我的分类器过度拟合。训练集上的表现是完美的(100% 正确)。
如果我使用相等的组,那么分类器也会开始分类到“小”组,但性能很差(比 FLD 或 LR 差)。
UPDATE2:我认为问题在于我使用的是全协方差矩阵。使用对角协方差矩阵运行给了我更多“平衡”的结果。