我有一个 5297X26 的不平衡数据集,class1 有 588 个样本,class2 有 4709 个样本。我使用以下代码来执行随机森林:
rfp<-randomForest(label~.,data=data,importance=TRUE,proximity=TRUE,replace=TRUE,sampsize=c(588,588))
因此,我可以通过在每次迭代中从每个类中选择 588 个样本来解决不平衡问题。但我也想对特征选择进行交叉验证。我打算使用的函数是 rfcv 。我尝试将 sampsize=c(588,588) 添加到函数中,但没有成功。如何在此函数中执行采样?