我的问题是关于创建分类器链
我正在处理的问题是一个多类问题,我必须分配 7 个可能的类之一。
为此,我首先训练了一个基于随机森林的分类器,结果并不是那么好。Precision 的期望值约为 95%+,而我的期望值是 79。
所以我开始为每个班级训练 7 个不同的分类器。当我参加第 1 课时,出于培训的目的,我将其他课程的类别标签转换为“其他”。
通过执行此过程,各个分类器的性能达到了约 95%+。
然后我想,可以让分类器链接(以瀑布方式),最准确的模型首先尝试分类,下一个最准确的模型留在行上进行预测,第三个最准确的模型紧随其后以此类推。训练过程仍然相同(对于 7 个单独的分类器)。
具体来说,假设分类器 1 预测 100 行并发现 10 行属于 1 类,其他 90 行将是“其他”。然后分类器 2 将对剩余的 90 个进行预测,这些将被标记为“其他”。然后分类器 3 将在左边继续,依此类推。
问题是,结果与他们单独进行时相去甚远。它下降到70年代的高位。
我试图找出性能急剧下降的可能原因,并想知道这是否是意料之中的,或者我需要修改一些东西以实现某种比较性能。
我感谢任何输入/建议/评论。