机器算法验证 - 只有一个类的分类器 - 吾爱随笔录

机器算法验证机器学习一类

2022-03-20 11:19:43

在一个简单的分类中，我们有两个类：0 类和 1 类。在某些数据中，我只有 1 类的值，所以没有 0 类的值。现在我正在考虑制作一个模型来为第 1 类的数据建模。因此，当新数据出现时，该模型将应用于新数据并找到一个概率，说明新数据与该模型匹配的可能性有多大。然后与阈值比较，我可以过滤不适当的数据。

我的问题是：

2个回答

使用某些方法可以做到这一点，并且肯定是一种有效的方法。不过，我不确定随机森林是否可以做到这一点。

生成人工数据意味着做出额外的假设，如果没有必要就不要这样做。

您可能想要研究的一种技术是所谓的一类 SVM。它完全符合您的要求：它尝试构建一个模型，该模型接受训练点并拒绝来自其他分布的点。

关于一类 SVM 的一些参考资料：

这两种方法已被证明是等效的。第一个估计一个超平面，它以最大距离将所有训练数据与特征空间中的原点分开。第二个估计包含训练实例的特征空间中具有最小半径的超球面。

一类 SVM 在许多 SVM 包中都可用，包括libsvm、scikit-learn (Python) 和kernlab (R)。

让我添加更多可能性：

一般的想法是，为与类的距离设置阈值可以让您决定样本是否属于该类，而不管是否有其他类。

其它你可能感兴趣的问题