除了 SVM,还有哪些分类模型可以通过仅包含正样本的数据集进行训练?在这种情况下,通常已知哪些模型表现更好?
更新:我的意思是由以下引用的句子描述的问题:
- “一类 SVM 是一种无监督算法,它学习用于新颖性检测的决策函数:将新数据分类为与训练集相似或不同”。
- “但是,如果你只有一类数据,而目标是测试新数据并找出它是否与训练数据相似呢?”。
除了 SVM,还有哪些分类模型可以通过仅包含正样本的数据集进行训练?在这种情况下,通常已知哪些模型表现更好?
更新:我的意思是由以下引用的句子描述的问题:
构建一类分类器有很多可能性。我在作者身份验证的背景下编写了许多简单的算法。这里只给出一个作者 X 的正样本,因此任务是判断给定文档是否由 X 撰写。但是,它可以通过调整特征来适应除作者身份验证之外的其他领域。这是我的两篇论文:
奥伦·哈尔瓦尼、卢卡斯·格拉纳、英娜·沃格尔。在没有明确特征和阈值的情况下验证作者身份:Pasi G.、Piwowarski B.、Azzopardi L.、Hanbury A.(编辑)信息检索进展。ECIR 2018。计算机科学讲义,第 10772 卷。Springer, Cham。https://doi.org/10.1007/978-3-319-76941-7_34
O. Halvani 和 M. Steinebach,“基于集成学习的高效内在作者身份验证方案”,2014 年第九届可用性、可靠性和安全性国际会议,2014 年,第 571-578 页,doi:10.1109/ARES.2014.84。