这种分类存在吗?

数据挖掘 分类 数据集 数据
2022-03-07 12:32:45

我对数据科学相当陌生,并试图查看是否存在满足我需求的分类类型。

我知道分为 2 个类别的分类将如下所示:

您有 2 个期望的结果,并且您尝试构建一个分类为0或的模型1如果这些模型不是 100% 准确,那么您将:

a) 遗漏一些真实值(圆圈的边缘)
b) 在每个类别中获取一些错误的值(圆圈之间的重叠)

但是,我正在寻找更像这样的东西:

在这种情况下,我只想预测1,我不介意是否0包含一些 s,但想确保预测尽可能多的1s。

在我看来,这实际上只是扩大了1图片中的橙色圆圈(s 的分类)。
我怎样才能做到这一点?

1个回答

除了用维恩图来表述问题,您还可以查看一个简单的二乘二表。通常问题以不同的方式以图形方式表述(参见维基百科页面的下图)。如果您只对预测值 1 的出现感兴趣,那么您只需关注分类算法的敏感性(或真阳性率)。这在 ROC 分析框架中很简单,您只需为分类器阈值选择一个最小值。然而,这是以非常低的特异性为代价的。您还应该考虑灵敏度/特异性结果的成本效益比。

https://en.m.wikipedia.org/wiki/Sensitivity_and_specificity

在此处输入图像描述