处理单类分类问题的分类模型有哪些?

机器算法验证 机器学习 分类 支持向量机 一类
2022-04-10 11:59:44

除了 SVM,还有哪些分类模型可以通过仅包含正样本的数据集进行训练?在这种情况下,通常已知哪些模型表现更好?

更新:我的意思是由以下引用的句子描述的问题:

  • “一类 SVM 是一种无监督算法,它学习用于新颖性检测的决策函数:将新数据分类为与训练集相似或不同”。
  • “但是,如果你只有一类数据,而目标是测试新数据并找出它是否与训练数据相似呢?”。
2个回答

构建一类分类器有很多可能性。我在作者身份验证的背景下编写了许多简单的算法。这里只给出一个作者 X 的正样本,因此任务是判断给定文档是否由 X 撰写。但是,它可以通过调整特征来适应除作者身份验证之外的其他领域。这是我的两篇论文:

奥伦·哈尔瓦尼、卢卡斯·格拉纳、英娜·沃格尔。在没有明确特征和阈值的情况下验证作者身份:Pasi G.、Piwowarski B.、Azzopardi L.、Hanbury A.(编辑)信息检索进展。ECIR 2018。计算机科学讲义,第 10772 卷。Springer, Cham。https://doi.org/10.1007/978-3-319-76941-7_34

O. Halvani 和 M. Steinebach,“基于集成学习的高效内在作者身份验证方案”,2014 年第九届可用性、可靠性和安全性国际会议,2014 年,第 571-578 页,doi:10.1109/ARES.2014.84。

这通常称为一类分类、单类分类、异常值检测甚至支持确定(即,分布的支持是什么)。

这些通常试图解决低密度拒绝的问题(即拒绝落在训练数据概率低的区域的点)。

有关一些理论,请参见此处,它还引用了各种技术方法和调查,尽管这是一个积极研究的领域。