是否可以仅为特征子集绘制决策边界?

数据挖掘 Python scikit-学习 随机森林
2022-03-02 00:32:41

我有一个带有 59 个特征的 sklearn 随机森林分类器作为输入。我想在索引 i1 i2 处仅绘制两个特征的决策边界。

如果我对剩余特征使用平均值/中值,则分类器最终会进入忽略特征 i1/i2 的路径。

我想在忽略其余特征的情况下绘制 i1/i2 的决策边界。这可能吗?还是根本有用?

1个回答

对于决策树,这既可行又有用。对于随机森林 (RF),每个决策树对这些特征都有自己的边界。而且,由于 RF 用原始特征的子集训练每棵树,因此有些树没有任何这些特征,因此没有边界。这也可能由于修剪而发生。因此,您有一组边界,可以同时绘制这些边界,以了解森林中的树木如何学习您的数据集。然而,这些边界也取决于其他特征。如果在某些树的较高节点中选择了一些更具解释性的特征,则低级别阈值可能会误导您。