假设您有许多输入特征,例如:
- x1 - 温度
- x2 - 星期几
- x3 - 降雨量
- ...
您正在尝试预测多个输出目标 - 使用神经网络,例如:
- y1:冰淇淋消费
- y2:防晒霜销量
- y3:雨伞销售
现在,您可以为每个目标变量建立一个回归模型,例如:
- 模型 1:x1、x2、x3、...、xn -> y1
- 模型 2:x1、x2、x3、..、xn -> y2
但是,如果相似的特征对每个模型都有用,它可以节省资源来构建单个模型来同时预测所有输出:
- 模型:x1, x2, x3, ..., xn -> y1, y2, ...., yn
我的问题(两部分)如下:
- 这样做有什么坏处?有没有关于这方面的文献?
- 构建具有相关目标变量的多输出模型是否更有意义?例如冰淇淋消费和防晒霜销售
我的经验是在以下方面进行权衡:每个目标变量的错误/准确性和所需资源(例如培训时间、维护多个模型等)。随着您添加更多目标输出变量,每个目标(例如在验证集上)的误差会增加,但模型数量、训练时间等会减少。
任何见解将不胜感激。