我当前的数据集有大约 900 条记录和 10 个特征。我正在尝试使用随机森林对一些数据进行分类。我当前的模型严重过度拟合数据,因此我正在尝试使用 rfcv 函数。我在理解这个函数的输出时遇到了一些麻烦。
这是一些示例代码
data(fgl, package="MASS")
tst <- rfcv(trainx = fgl[,-10], trainy = fgl[,10], scale = "log", step=0.7)
我可以从中打印一些输出,但我不确定如何解释这个?
9 6 4 3 2 1
0.2102804 0.2196262 0.2429907 0.2523364 0.3551402 0.5607477
我也有重要性函数的日志
MeanDecreaseGini
RI 23.358203
Na 15.901377
Mg 25.923452
Al 24.587295
Si 12.586816
K 13.731823
Ca 19.680839
Ba 14.206922
Fe 6.774196