数据挖掘 - 分类器链 - 吾爱随笔录

我的问题是关于创建分类器链

我正在处理的问题是一个多类问题，我必须分配 7 个可能的类之一。

为此，我首先训练了一个基于随机森林的分类器，结果并不是那么好。Precision 的期望值约为 95%+，而我的期望值是 79。

所以我开始为每个班级训练 7 个不同的分类器。当我参加第 1 课时，出于培训的目的，我将其他课程的类别标签转换为“其他”。

通过执行此过程，各个分类器的性能达到了约 95%+。

然后我想，可以让分类器链接（以瀑布方式），最准确的模型首先尝试分类，下一个最准确的模型留在行上进行预测，第三个最准确的模型紧随其后以此类推。训练过程仍然相同（对于 7 个单独的分类器）。

具体来说，假设分类器 1 预测 100 行并发现 10 行属于 1 类，其他 90 行将是“其他”。然后分类器 2 将对剩余的 90 个进行预测，这些将被标记为“其他”。然后分类器 3 将在左边继续，依此类推。

问题是，结果与他们单独进行时相去甚远。它下降到70年代的高位。

我试图找出性能急剧下降的可能原因，并想知道这是否是意料之中的，或者我需要修改一些东西以实现某种比较性能。

我感谢任何输入/建议/评论。