我正在建模一个回归问题。初始尝试产生以下结果:
labels.mean(): 0.00018132978443886167
labels.std(): 0.013450786078937208
predictions.mean(): 0.0005549060297198594
predictions.std(): 0.00430255476385355
如您所见,均值已关闭,标准差完全不同。我想知道它说明了什么?
我的猜测:这是否意味着我的特征没有足够的辨别力,以至于模型看到带有正面和负面标签的示例,因此输出的差异很小?
我正在使用XGBRegressor, 运行回归,并提前停止。我有 100 万个训练示例、10 万个验证示例(用于提前停止)和另外 10 万个用于测试目的(上面显示了平均值和标准差)。
我还检查了三组的标签分布基本相同。