由于随机 Forrest 回归中响应和残差之间的相关性,重新调整预测以纠正离散度

数据挖掘 机器学习 预测建模 随机森林
2022-02-15 21:08:54

我正在使用随机森林回归,我观察到残差之间存在很强的正相关(u^) 和响应变量 (y) 导致分散:预测被低估,分别。高估,对于大,resp。小,响应变量的值。请注意,预测之间没有相关性 - 估计的响应变量 - (y^) 和残差 (u^) 这对于随机森林来说是预期的。

这个问题是由于随机森林可以被视为局部平均平滑器(本文中的第 3 页),并且在这篇文章这篇文章中都有很好的记录。

这里的答案表明,纠正这种分散的一种方法是“将模型包装在某种经典回归中,这会将响应重新调整为所需的分布。”

是否可以计算一些预测yc=f(y^)已针对这种分散进行了校正?如何 ?

0个回答
没有发现任何回复~