机器算法验证 - 关于组合 SVM - 吾爱随笔录

假设我们有一个监督训练集 $T=\{ (x_1, y_1),\dots, (x_n,y_n)\}$ 在哪里 $x_i$ 是一个例子，并且 $y_i \in \{-1,+1\}$ 是它的标签。进一步假设示例只能通过特征提取函数观察到 $f(x;s)$ 在哪里 $x$ 是一个例子，并且 $s \in \{s_1,\dots,s_m\}$ 是特征提取的论据。对于每个可能的值 $s$ ，我们训练一个线性支持向量机（在集合上 $\{ (f(x_1;s), y_1),\dots, (f(x_n;s),y_n)\}$ ）。让 $w_i$ 学习 SVM 的权重 $s=s_i$ .

我的问题是组合这些 SVM 的子集以改进分类。具体来说，对于一个测试示例 $x$ ，假设我们只有前两个 SVM 的分数（特征提取成本很高）： $w_1^T f(x;s_1)$ 和 $w_2^Tf(x;s_2)$ . 我们如何（最佳地）结合这些分数来获得最终决定？一个简单的答案是为每个子集训练一个 SVM $s$ 值，但这并不容易处理。

理想情况下，我对概率解释感兴趣。假设每个 SVM 模型 $P(y|f(x;s_i))$ , 我想表达 $P(y|f(x;s_1), f(x;s_2))$ 使用 $P(y|f(x;s_1))$ 和 $P(y|f(x;s_2))$ .