假设我有兴趣对由不同内容类型组成的一组实例进行分类,例如:
- 一段文字
- 图像_
作为relevant或non-relevant针对特定类C。
在我的分类过程中,我执行以下步骤:
- 给定一个示例,我将其细分为文本和图像
- 第一个 SVM 二元分类器 (
SVM-text),仅对文本进行训练,将文本分类为relevant/non-relevant类C - 仅在图像上训练的第二个 SVM 二元分类器 (
SVM-image) 将图像分类为relevant/non-relevant类C
两者SVM-text并SVM-image产生对所分析内容(文本或图像)与该类相关的概率的估计C。鉴于此,我能够说明文本是否相关C以及图像是否相关C。
然而,这些估计对原始样本的片段(文本或图像)有效,而不清楚如何获得对整个原始样本(文本+图像)的一般意见。如何方便地结合两个分类器的意见,从而得到对整个原始样本的分类?