我在研究主题中尝试了随机森林模型,但在验证阶段遇到了问题。
当我使用随机森林的最终模型在独立数据集上进行预测时,我收到了以下消息:
新数据中的预测变量类型与训练数据中的预测变量类型不匹配
因此,为了检测我的因素/变量中的不同类别,我使用了:
levels(Train$Aquifer.media) levels(Test$Aquifer.media)
对于这个因素“Aquifer.media”,我有:
Train dataset: "Carbonates rocks" "Crystalline rocks" "Siliciclastic sedimentary rocks" "Unconsolisated sediments rocks" "Volcanic rocks"
Test Dataset: "Crystalline rocks" "Siliciclastic sedimentary rocks" "Unconsolisated sediments rocks" "Volcanic rocks"
我检测到预测变量属于不同的类别,我想知道,我该如何解决这个问题?
是否可以删除因子中的某些类别?