我正在使用随机森林回归,我观察到残差之间存在很强的正相关(u^u^) 和响应变量 (yy) 导致分散:预测被低估,分别。高估,对于大,resp。小,响应变量的值。请注意,预测之间没有相关性 - 估计的响应变量 - (y^y^) 和残差 (u^u^) 这对于随机森林来说是预期的。
这个问题是由于随机森林可以被视为局部平均平滑器(本文中的第 3 页),并且在这篇文章或这篇文章中都有很好的记录。
这里的答案表明,纠正这种分散的一种方法是“将模型包装在某种经典回归中,这会将响应重新调整为所需的分布。”
是否可以计算一些预测yc=f(y^)yc=f(y^)已针对这种分散进行了校正?如何 ?