EasyEnsemble 解释

数据挖掘 Python 随机森林 熊猫 阶级失衡 集成建模
2022-02-22 20:50:03

有人可以解释一下 EasyEnsemble 算法是如何工作的吗?我将它用于不平衡少数类的预测模型。

请不要让我参考这篇论文,因为这对我来说毫无意义。 不平衡数据集的 EasyEnsemble 和特征选择

我在 Pandas 中使用算法,以及 GitHub UnbalancedDataset上的 UnbalancedDataset 库

我得到了一组矩阵作为 O/P,我不知道最后如何使用它来训练随机森林。

谢谢

1个回答

该工具箱仅管理采样,因此这与论文中的算法略有不同。

它的作用如下:它创建了几个平衡的数据子集。这些子集是通过对多数类进行随机欠采样而创建的。这就是你从工具箱中得到的。

要获得论文中的内容,您需要为每个子集训练一个 AdaBoost 分类器。因此,你得到的是一组合奏。

希望这会有所帮助。