我想澄清随机森林文献中的观点。在随机森林中,我们从数据子集中选择随机特征,即它是单个树的数据子集的特征子集。但是当我们测试数据时,让我们从测试数据中取出一个测试样本“v”。数据具有“5”个特征。
- 树一是使用特征 3 和 2 构建的。
- 树二是使用特征 2,3 和 5 构建的。
- 树三是使用特征 1,2 和 3 构建的。
- 树 4 是使用特征 1、4 和 5 构建的。
在叶节点,我们将有概率显示“v”点属于哪个类。
我的问题是:每个森林是否会从测试数据样本“v”中选择与构建树时使用的相同的特征。?
例如,一号树将使用功能 3 和 2。而二号树将分别使用功能 2、3 和 5。