组合多个分类器构建多模态分类器

数据挖掘 分类 支持向量机
2022-01-29 17:54:29

假设我有兴趣对由不同内容类型组成的一组实例进行分类,例如:

  • 一段文字
  • 图像_

作为relevantnon-relevant针对特定类C

在我的分类过程中,我执行以下步骤:

  1. 给定一个示例,我将其细分为文本和图像
  2. 第一个 SVM 二元分类器 ( SVM-text),仅对文本进行训练,将文本分类为relevant/non-relevantC
  3. 仅在图像上训练的第二个 SVM 二元分类器 ( SVM-image) 将图像分类为relevant/non-relevantC

两者SVM-textSVM-image产生对所分析内容(文本或图像)与该类相关的概率的估计C鉴于此,我能够说明文本是否相关C以及图像是否相关C

然而,这些估计对原始样本的片段(文本或图像)有效,而不清楚如何获得对整个原始样本(文本+图像)的一般意见。如何方便地结合两个分类器的意见,从而得到对整个原始样本的分类?

1个回答

基本上,您可以做以下两件事之一:

  1. 结合来自两个分类器的特征。即,SVM-textSVM-image可以训练SVM同时使用文本和视觉特征的单曲。
  2. 使用集成学习如果您已经有来自不同分类器的概率,您可以简单地将它们用作权重并计算加权平均值。对于更复杂的情况,有贝叶斯组合器(每个分类器都有其先验)、提升算法(例如,参见AdaBoost)等。

请注意,最初创建的集合是为了组合不同的学习者,而不是不同的特征集。在后一种情况下,集成具有优势,主要是在不同类型的特征不能有效地组合在一个向量中的情况下。但总的来说,组合特征更简单、更直接。