这取决于你想展示什么。使用指标时,您不应只按原样获取值,而应查看每个指标告诉您的信息。基线_1 并不比基线_0 更好/更差,因为它在度量X 中具有更高/更低的值。两个基线都对给定数据集提供了一个有趣的视角,如果不确定,我建议保留两者。
几点注意事项:
- 在说基线时,我将参考您在帖子中所说的两个基线策略
- 我将使用准确性指标作为示例,但我所说的对于任何指标都是正确的。
为什么要使用基线?
人们通常倾向于将准确性(或其他度量)视为绝对值。例如准确度=0.9?“非常好”,准确度=0.3?“很坏”。然而,这不是真的,因为度量受到类的数量和它们之间的样本比例的影响。
然而,在具有 1000 个类别的分类任务中,0.3 的准确度可以说比在二元分类任务中达到 0.9 的准确度要困难得多(假设两种情况下的类别平衡)。
这是基线。它们可以显示模型比转储分类策略好多少。
基线如何帮助?
基线有助于为您的指标设置下限。例如,二分类任务的准确度为 0.55 略好于随机,但同样的准确度在 10 类设置上要好得多。基线有助于量化这一点,并告诉您比预测随机值或最常见值要好多少。
基线有什么影响?
现在谈谈为什么要保留两个基线:
- 第一个基线(即随机)有助于显示指标如何受到数据集上类数的影响。
- 第二个基线(即最常见的)有助于显示指标如何受到类不平衡的影响。
基线实际上如何帮助?
让我们有两个模型,一个精度为 0.92,另一个精度为 0.93。第二个模型比第一个模型好多少?这取决于您的基线值。如果您的基线准确度为 0.5,那么这两个模型都相对较强,并且差异并不显着。如果您的基线为 0.9,那么模型就没有那么强大,并且该幅度的改进更为显着。