我想使用 val.prob(rms 包,R)评估随机森林的校准。我使用它并获得输出没有问题,但我觉得结果可能不准确,因为我不相信随机森林(predict.randomForest,也在 R 中)输出的类成员概率是正确的预测概率用于校准。
我不相信在以下意义上这是校准的真实概率:我认为随机森林分数不等同于发生的事件(即 30% 的分数并不意味着你有 30% 的机会患上疾病) .
我的主要问题是:在尝试评估模型校准时,使用类成员概率的适当方法是什么?如果可以使用类成员概率,有哪些方法可以改进校准?