在随机森林中测试数据?

数据挖掘 机器学习 随机森林 算法
2022-03-13 06:42:56

我想澄清随机森林文献中的观点。在随机森林中,我们从数据子集中选择随机特征,即它是单个树的数据子集的特征子集。但是当我们测试数据时,让我们从测试数据中取出一个测试样本“v”。数据具有“5”个特征。

  1. 树一是使用特征 3 和 2 构建的。
  2. 树二是使用特征 2,3 和 5 构建的。
  3. 树三是使用特征 1,2 和 3 构建的。
  4. 树 4 是使用特征 1、4 和 5 构建的。

在叶节点,我们将有概率显示“v”点属于哪个类。

我的问题是:每个森林是否会从测试数据样本“v”中选择与构建树时使用的相同的特征。?
例如,一号树将使用功能 3 和 2。而二号树将分别使用功能 2、3 和 5。

1个回答

是的,它必须使用相同的功能。如果不是,则训练算法没有任何意义。