众所周知,ZeroR 模型用于预测给定数据集中的多数类。
话虽如此,ZeroR 是否是一个合适的性能基准,前提是一个具有平衡的数据集(50/50)?
如果不是,那么用于二元分类(正/负)的朴素贝叶斯分类模型的良好基线是什么?
众所周知,ZeroR 模型用于预测给定数据集中的多数类。
话虽如此,ZeroR 是否是一个合适的性能基准,前提是一个具有平衡的数据集(50/50)?
如果不是,那么用于二元分类(正/负)的朴素贝叶斯分类模型的良好基线是什么?
当然,ZeroR 是一个非常好的基线。在这种情况下,我认为最好将其称为随机基线而不是多数基线,因为它就是这样。
据我所知,这是唯一可用于任何分类任务的基本基线。其他基线将涉及基于特定任务的更复杂的东西。获得更具竞争力的基线的标准方法是使用最先进的方法来完成任务。
顺便说一句,基线或评估方法不依赖于学习算法,它是 NB 还是任何其他分类方法都没有关系。