回归问题中的响应变量,, 使用数据矩阵建模.
在符号上,这意味着:
~
然而,可以分离成可以独立建模的不同组件。
在什么条件下会,整体预测,有更好或更差的表现,单个模型的总和?
为了提供更多背景信息,使用的模型是 GBM。我惊讶地发现为特定的训练模型 导致与使用整体模型大致相同的性能 预测 . 这是高度相关的。事后看来,这并不奇怪,因为为与目标相关的向量训练模型也与目标相关。
为了类比,以线性模型和独立响应变量为例。
整体模型为
不难看出,模型的总和就是总和的模型。
如果 是独立的,那么 也会如此。这意味着每个模型系数都将保持不变。以二维情况为例(其中 有两列)。
为了 ,