我检查了R 中randomForest的包和rfsrc包,但在训练随机森林模型时找不到一种简单的方法来应用观察/案例权重。有没有办法做到这一点?
作为替代方案,我考虑过复制我的观察结果(例如,如果观察结果的权重为 2,则复制一次),但认为这对于非整数大小写权重来说效率低下且困难。
我检查了R 中randomForest的包和rfsrc包,但在训练随机森林模型时找不到一种简单的方法来应用观察/案例权重。有没有办法做到这一点?
作为替代方案,我考虑过复制我的观察结果(例如,如果观察结果的权重为 2,则复制一次),但认为这对于非整数大小写权重来说效率低下且困难。
不要复制到重量增加的样品。这将使袋外交叉验证变得过于乐观。
分层和类权重都是在 randomForest 中实现的,这里有一些其他的线程。