对于我面临的这个问题,我很难找到任何答案。
我有一些我正在测试的文本分类器,它们适用于适合任何预定义类别的数据,但是如果我输入,让我们说“fhjakdlfsah”,它仍然会将它分配给某个类别,因为我猜predict_proba 功能必须为所有类别加 1。
我在这里缺少什么吗?我很难找到解决方案,我想这是一件很常见的事情。现在我正在使用 sklearn 的梯度提升,并尝试按照其他人的建议将其包装在 onevsrestclassifier 中,但它仍然具有相同的东西,所有概率加起来为 1,并且它被分配了最高概率
基本上我正在寻找一种解决方案,可以说是的,这适合这些类别之一,或者不,这不适合这些类别中的任何一个。
任何帮助将不胜感激,因为我在这里陷入困境
谢谢!