R中用于选定变量的随机森林命令

数据挖掘 r 特征选择 随机森林 代码
2022-03-11 09:57:51

我在网上只能找到一个随机森林是如何使用句点在数据集中的所有变量上运行的:

RF <- randomForest(sale ~ ., data = TrainSet, importance = TRUE)

如果我只想将 RF 应用于数据集中的选定变量怎么办?我需要先删除变量吗?

我尝试了以下方法,但出现错误: RF <- randomForest(sale ~ v1,v2,v3, data = TrainSet, importance = TRUE)

1个回答

你所要做的

RF <- randomForest(sale ~ v1 + v2 + v3, data = TrainSet, importance = TRUE)

这是 R 的公式表示法。它对随机森林模型没有多大意义,但它就是它的工作原理。