绝对可以创建一种强制高精度类标记算法的方法(以召回的自然成本)。更重要的是-您可以(至少)使用任何为预测提供百分比计算的方法来做到这一点,这是绝大多数分类器。正如您所提到的,关键是找到可接受的最小精度值并在该值处削减预测。
如果最小精度是您唯一的约束,并且您的解决方案对召回不敏感(正确分类网站的所有或最高比例),这是一件非常简单的事情。您的一些较低百分比的观察将被分类,但那些更有可能被正确分类。
例如,如果您的 Precision 地板是 70%,那么您的剪裁可能看起来像这样:

落入绿色部分的观察预测可以归类为正样本,落入红色部分的预测将是未分类的。
这种方法对于朴素贝叶斯来说就足够了。其他一些方法(SVM、梯度提升机等)可能会受益于自定义损失函数定义,您可以在其中定义一个不成比例地惩罚假阳性预测的函数。
就像是:
(是的一世= 0 ) → ( d= s ) ∧ (是的一世= 1 ) → ( d= 1 )
L ( p ) =∑一世(p一世-是的一世)2dn一世
大号( p )= 损失函数
p一世= 预测的类似然
是的一世= 实际类(0 为负例,1 为正例)
n一世= 观察次数
s= 误报的惩罚参数。
相对于假阴性,会严厉惩罚假阳性。它也可以根据您的需要进行调整,以或多或少地严厉惩罚误报。为了小号= .5,函数看起来像:

请注意,此函数不一定定义您应该采取的方法,而只是一种可能的方法。要创建完全适合您的用例的自定义损失函数,您需要了解误报和误报的相对成本,并相应地自定义函数。