我有一个逻辑回归监督分类器,n=365 observations它m=179 attributes在c=5 classes. 它使用非常强大的交叉验证程序以 94.9% 的准确率执行。该模型天真地假设每个新观察值都将属于其中一个类别,但可能存在一个完全未知类别的实例。 有没有办法对None of the above类别进行建模?我打算查看概率,但即使模型预测错误,预测的概率也非常高。
如何在逻辑回归中拥有“以上都不是”类别?
机器算法验证
机器学习
物流
线性模型
异常值
监督学习
2022-03-26 03:25:53
2个回答
首先,您说的是多项回归,而不是逻辑回归。其次,逻辑回归和多项回归都不是分类器。逻辑回归和多项回归都预测属于某个类别的概率。要对它们进行分类,您需要一个决策规则(如果概率大于某个值,则将其分类为某个类)。
由您来定义决策规则。您可以自由决定,如果属于任何类别的概率不大于某个值,则不能选择任何类别。
没办法,你要么已经有一些非类数据,然后将它们设置为第 6 类,然后用第 6 类训练模型。或者您设置一些阈值来对样本落入由隐马尔可夫模型等评估的每个类别进行评估的可能性进行评分,但准确性会比机器学习模型差。而且由于您现在甚至没有非类数据,因此您无法真正拥有一个可以区分真正的非类数据的公平分类器。
其它你可能感兴趣的问题