任何人都可以解释为什么/如果目标变量转换在处理基于树的模型时会有所帮助吗?
我已经看到了这个出色的回复,它很好地解释了为什么它不应该影响转换输入,但我无法找到任何关于输出的信息。
可以使用像记录日志这样的转换或使用响应变量的分位数转换有帮助吗?
实际上,XGBoost当使用输出的正常分位数变换时,我们正在使用并获得更好的结果,在获取日志时甚至会得到更好的结果(我们的响应变量是价格,高度向右倾斜)但我不知道这是否合理理论上或只是随机机会。
任何人都可以解释为什么/如果目标变量转换在处理基于树的模型时会有所帮助吗?
我已经看到了这个出色的回复,它很好地解释了为什么它不应该影响转换输入,但我无法找到任何关于输出的信息。
可以使用像记录日志这样的转换或使用响应变量的分位数转换有帮助吗?
实际上,XGBoost当使用输出的正常分位数变换时,我们正在使用并获得更好的结果,在获取日志时甚至会得到更好的结果(我们的响应变量是价格,高度向右倾斜)但我不知道这是否合理理论上或只是随机机会。